SoundHound, 智能语音巨头赛道上的奔跑者

AI明星公司的专利策略研究 2023-2-2

DELIDA-logo.jpg



【摘要】“专利资产是商业、技术和法律的集合,创业公司必须理解并熟悉专利的游戏规则,也应该制定适合自己的专利战略。由于创业公司常常面临着特别高的专利风险,因此在关注市场发展和竞争格局的同时,更需要在有限的预算内挖掘有价值的专利组合,优化自身的专利资产配置。



SoundHound,智能语音巨头赛道上的奔跑者


by

德理达-智能制造团队

智能语音领域的赛道

智能语音技术作为人工智能的数据入口之一,具有较高的技术壁垒,所涉及的学科包括语言学、声学、信号处理、云计算技术等,在全球的智能语音市场中基本形成巨头公司垄断的竞争格局,比如Google、Apple、Microsoft、IBM、Amazon、Nuance、及中国的科大讯飞等巨头公司,这些公司占据了绝大部分的市场份额。

其中,一直以来专注语音识别技术(Automatic Speech Recognition,简称ASR)的Nuance自2005年与ScanSoft公司合并后,成为全球最大的智能语音厂商,凭借自身先进的语音识别、自然语言理解技术以及成熟的语音解决方案,已经成为这个赛道上的领跑者。Nuance也是在这一领域拥有专利数量最多的公司。

近些年,随着半导体芯片技术及无线网络技术的快速发展,以及基于人工智能的应用在多个领域的突破,语音识别领域吸引了一些创业者进入,这些创业者从语音领域的垂直市场出发,竞相进入了这条巨头公司的赛道。

语音垂直领域的参赛者:SoundHound

本期我们介绍一家语音垂直领域的参赛者,即总部位于美国加州Santa Clara的创业公司,SoundHound。

相信不少人有过这种困惑:耳边萦绕着一种熟悉的旋律,就是想不来歌曲的名字;或者突然想找一首歌,但不知道演唱者,仅凭只言片语的歌词在网络上检索,如果运气好的话,也能够得到热心网友的帮助,比如,

微信图片_20230202131908.jpg

SoundHound就是为了解决这一用户需求应运而生的。其创始人兼CEO是Keyvan Mohajer,他在斯坦福电气工程学院期间的研究方向就是语音识别技术,并于2005年创办了 SoundHound,专注音乐识别这一垂直领域,致力研发使人们能够通过播放或哼唱找到歌曲名称的技术。这虽然看起来是一个冷门的应用,但的确迎合了一部分音乐爱好者的诉求。

美国的创业者通常有着较强的知识产权意识,技术在不能作为技术秘密保护的情况下,专利保护几乎是创业者不二的选择:

在公司成立的前几年,尽管Keyvan Mohajer把他们早期研发的蛰伏期称为“硅谷隐藏得最深的秘密”,但他们还是围绕着音乐识别技术积极地在全球申请专利。从这些专利中可以看出Keyvan Mohajer作为主要发明人参与了早期的研发,这些公开的专利包括,

音乐检索(US7698254B2/US8805686B2)

高音识别(US20080167862A1)

颤音检测(US8494842B2)

噪音消除(US8452586B2)

音乐列表处理(US8856148B1)等;

专利分布的市场包括美国、加拿大、中国、欧洲、香港、印度、日本、韩国等国家和地区。

厚积薄发的技术优势:“speech-to-meaning”技术组合

基于上述技术,SoundHound于2009年前后推出了可用于iPhone上的应用程序:SoundHound®该应用程序可以使用声音识别技术查找有关歌曲的信息。也就是说,它不仅可以根据歌曲的原声来识别曲目,还可以根据用户哼唱来辨识,并且具有很高的精准度,这款APP很快受到了音乐爱好者的青睐。

2012年9月,SoundHound宣布他们已经拥有超过1亿名用户。根据iTunes的统计,截至2017年6月,SoundHound的音乐应用下载量已超过3亿次。

image.png

良好的用户反馈得益于SoundHound厚积薄发的技术优势:

大多语音识别方案使用语音到文本(speech-to-text),然后处理文本以表达含义的技术,这使得在语音处理中引入了一个额外的转录步骤,这一过程会导致错误增加并且延迟,而错误和延迟非常影响用户体验。

SoundHound另辟蹊径地采用 “speech-to-meaning”技术组合,该技术组合采用非文本检索系统来检索预先存储的音乐,能够理解用户输入的深层含义。相较于例如Apple的Siri或Amazon的Alexa这类系统,SoundHound的技术更能够处理复杂的语法。

围绕这一核心技术,SoundHound在全球布局了多个专利组合,已公开的专利有34件。

在资本的追逐下快速奔跑

投资人敏锐的目光几乎不会放弃任何一个有潜力的创业者。SoundHound的成长似乎也是一路由投资人伴随。SoundHound先后在2008年和2009年完成了两轮总计一千万多美元的融资;他们最近的一笔融资发生在2017年初,投资额度高达7500万美元,该笔资金由图形芯片厂商巨头Nvidia领投,三星催化剂基金(Samsung Catalyst Fund)等公司跟投。

充盈的运营资金使得SoundHound加快研发和商业拓展的速度,SoundHound不再局限于在音乐搜索及歌曲识别等方面创造更好的用户体验,而是基于其掌握的“speech-to-meaning”技术组合,向语音识别平台和语音虚拟助理等方向进军,为这一技术拓展更为广阔的应用空间。

2015年底,SoundHound发布了基于云引擎的语音识别平台Houndify及其相应App Hound,该平台为开发者提供了上百个自然语言处理的应用领域,包括本地搜索、天气预测、财务信息和旅游协助,也包括车联网和智能驾驶等,而这些领域正是语音识别巨头公司的赛道

创业路上不可预知的专利风险

市场的认可及投资人的热捧并不能保障创业者在赛道上畅通无阻地奔跑,尤其是在巨头们的赛场上。因为巨头们在竞赛中总是喜欢相互推搡和争吵,而且巨头们丰厚的收入和高额的利润也总是吸引专利NPE(Non-Practicing Entities,非执业实体)的关注,作为创业者总是不可避免地在巨头之间的博弈中被殃及

从2012年8月开始,一家设立于美国德州的专利运营公司Blue Spike, LLC(下称Blue Spike),以其持有的“signal abstracting”技术的相关专利,先后向美国德州东区联邦地院提起总计超过70起的专利侵权诉讼:

Blue Spike持有的4项系争专利(US7346472B1、US7660700B2、US7949494B2与US8214175B2)的名称均为“Method and device for monitoring and analyzing signals”。

Blue Spike在这些诉状指出,其signal abstracting技术可用于分类、识别、监控与比对分析数字信号,应用场景包括图像、声音、影像、多媒体信息、生物辨识信息等领域。

在Blue Spike猎获的被告中,有像Google、Adobe Systems、Facebook、Sage Software等这样的巨头,也包括像SoundHound这样的创业公司。

无独有偶,在同为专利运营公司的Global Interactive Media,Inc.(简称GIM)发起的一系列诉讼中(诉讼对象包括Hubbard, ReelzChannel, TuneIn, Scripps Interactive, Viggle and TimeWarner Cable等公司),SoundHound也是诉讼目标之一。而在此之前,SoundHound在音乐识别领域的直接竞争对手Shazam公司已经与GIM达成了协议

这些当然不是偶然的事件,在一个创业公司快速发展的过程中,如果产品畅销且财务健康或者正在融资或快速扩充的关键时机,当然是NPE或者直接竞争对手的诉讼目标。实际上从2011年开始,SoundHound就不断地被拖入专利侵权的诉讼中。

image.png

巨头公司有健全的应急机制和丰富的应对经验,在面对风险时能够从容不迫地调用各种资源,可以游刃有余地去化解各种障碍。但对创业者而言,尤其是在公司的初期阶段,有限的时间和精力更需要兼顾研发和市场,创业者在面对突如其来的专利风险时,很难显得从容和淡定,但又不得不应对。

就像SoundHound的知识产权负责人Jonah Probell所说的: “Not playing the game is not an option” 。

重新认识专利游戏

重视专利在市场竞争中的作用

Jonah Probell是一名具有研发背景和专利组合管理经验的美国专利代理人,他于2016年2月入职SoundHound,在此之前,Jonah Probell先后在七家公司从事研发,市场营销和专利组合管理工作,在其中一家芯片公司Arteris期间,Jonah Probell曾起草过大约45个专利家族,其中大部分专利组合以5000万美元价格出售。

Jonah Probell一直研究创业公司的专利战略和专利组合管理,他认为专利资产是商业,技术和法律的集合,创业公司必须理解并熟悉专利的游戏规则,也应该制定适合自己的专利战略

由于创业公司常常面临着特别高的专利风险,因此,在关注市场发展和竞争格局的同时,更需要在有限的预算内挖掘有价值的专利组合,优化自身的专利资产配置

image.png

Jonah Probell在他的《Patenting for the Small Company》一书中详细地阐述了上述观点,并认为创业公司的管理者需要紧密地跟踪内部研发,要从忙碌的研发中挖掘真正有价值的创新,并应该高效地完成创新成果的权利化。Jonah Probell还认为保持与外部法律顾问的沟通频率也十分重要

目前,SoundHound正在组建自己的专利团队,他们正在招募更多经验的专利律师加入,希望在知识产权,数据开源,和用户隐私等方面积累更多的专业经验,以及挖掘更有价值的专利组合。

开发专利组合并优化专利资产的配置

自2012年始,SoundHound随着商业拓展或受专利纠纷的影响,专利的申请数量明显增加,申请专利的技术点也呈现了多样化的特点,比如照相时识别声音以将声音和图像关联、用于广告的语音识别技术、借助语音识别向旅行者提供实时援助、无人驾驶中的自然语言处理、通过语音建立用户档案等偏向应用场景的专利。

在2016年的下半年,SoundHound回溯了其在语音识别中的核心优势,特别重新梳理了其一直以来宣称的“speech-to-meaning”技术组合中的创新点,相继提出了例如连续音频匹配,自然语言库的扩展,以及双模语音识别等一些更为底层技术的发明专利。在这些专利中,文本的撰写风格也发生了微妙的变化,尤其是对权利要求中技术特征的描述,也一改早期的对技术方案的直白描述的方式,呈现了语言更加精准、用语更加概括的特点,说明企业更加重视专利文本撰写质量

和巨头公司结队奔跑

创业公司和巨头公司们在同一个赛道上竞争,在保证快速奔跑的同时还能保持公司成长的独立性实属不易。

SoundHound在这一领域中最直接的竞争对手Shazam公司已于2017年12月卖身Apple。2015年,SoundHound与韩国现代汽车(Hyundai Motor)展开合作,共同研发 “Intelligent PersonalAgent” 智能语音识别系统。

随着Nvidia与Samsung两家巨头对SoundHound的战略投资,使得SoundHound找到了一种与巨头们结队而行的发展模式:一边将自己的语音识别软件与Samsung的硬件产品进行整合布局物联网(IoT)业务;一边将其智能语音识别系统与Nvidia的车载信息娱乐系统相结合,趁着Nvidia的东风涉猎自动驾驶领域。

十几年的成长,SoundHound逐渐成熟,并在这个巨头公司竞争的赛场上找到了一条属于自己的跑道。

* 以上文字仅为促进讨论和交流,不构成法律意见或咨询建议。



上海:上海市浦东新区碧波路690号张江微电子港7号楼6楼     
 
无锡:无锡市梁溪区中山路288号云蝠大厦10楼A09室