Next IT，虚拟助理领域的另类玩家

AI明星公司的专利策略研究 2023-2-2

【摘要】Next IT持续积累自己的专有技术和专利资产，这些专利的申请时机和技术紧密结合他们研发节奏和产品特点，在一片蓝海的C端市场以及各种风口的巨大诱惑面前，能够心无旁骛坚持自己的战略和技术路线，对这创业公司而言是难能可贵的。

Next IT，虚拟助理领域的另类玩家

▼

德理达-智能制造团队

智能虚拟助理（Intelligent Virtual Assistants）是一种自助式服务解决方案，即利用设备模拟人类互动来执行特定任务，帮助个人完成多项任务或多项服务的虚拟助理，比如回答问题，提供说明或建议。智能虚拟助理涵盖了人机交互、机器学习，数据处理，以及自然语言理解等人工智能的各个方面的技术，使得设备能够像人类一样学习，推理和理解。

智能虚拟助理不像传统互联网的PC设备或者移动互联网的手持终端可以通过图形化的人机交互（Graphical User Interface，简称GUI）界面向产品输入指令，而更多的是以对话作为人机交互的方式，这就使得语音识别技术在这一领域得到了充分的发挥和应用。

即，人们想要获得服务的时候，不需要有“鼠标或者触控屏”这个中间载体，而是直接用语音提出需求，就能获得语音或界面的反馈结果。

▼

C端市场中虚拟助理玩家的困惑

我们在《AI技术专利研究系列：SoundHound，智能语音巨头赛道上的奔跑者》中提到过一些巨头公司很早就涉猎这一领域，Google Assistant Allo、Apple Siri、Microsoft Cortana、IBM Watson、Amazon Echo和Alexa，以及Facebook M等智能虚拟助理，最近跟上的，还有国内小米公司开发的“小爱同学”，也有相当有趣的使用体验。

对AI领域的创业者而言，因为不具备类似的产业生态和硬件入口的条件，创业者更倾向于向C端市场中的终端用户提供咨询或服务，比如出行安排，日程管理，购物或订餐服务等等。创业者如果在语音识别技术中有自己的专有技术和场景数据，就能开发出包括多任务或垂直类服务的差异化产品。就像我们之前提到的注于音乐识别领域的SoundHound公司和Shazam公司。

尽管语音识别技术相对技术和使用便捷，但用语音代替鼠标和触控屏并非是一件简单的事情，这是因为用户在真实的场景中，输入的语音极具个性化，也很随机：

比如用户经常提出例如“五一假期我应该去哪里度假”这样的开放性的问题，如果没有选项按键的帮助下，设备很难理解用户的真正意图，而用户也时常不能从设备那里获得真正需要的信息和帮助。也正是因为如此，大部分用户在兴致勃勃地买回一个聊天机器人后，过了新鲜期就会将其束之高阁后就鲜有问津了。

▼

虚拟助理B端市场的玩家，Next IT

在特定场景下，用户的需求是特定的，智能虚拟助理产品也要结合应用场景，比如我们本期要介绍一家在结合应用场景的实现智能虚拟助理的创业公司：Next IT。

Next IT成立于2002年，位于华盛顿州的Spokane Valley，是一家业内首批在电话助手里提供自然语言识别服务的公司。该公司早期的研发主要集中于在异构数据处理及自然语言处理（NLP），该公司最早的一个专利组合（以2004年申请的专利US756536B2为代表的专利家族）基于正则表达式分析器对非结构化的数据进行处理，Next IT基于该专利组合包括美国、欧洲以及中国香港申请的17件专利。

Next IT的另一件相对基础的专利组合为US8943094B2为代表的专利家族，这一专利组合描述了基于自然语言输入来搜索和检索文档的各种情况，Next IT的CEO Fred Brown作为该专利的主要发明人, Fred Brown是自然语言处理（NLP）的先驱和连续创业者，他曾先后参与创建了12家公司。

鲜为人知的，在Apple Siri、Microsoft Cortana、以及Amazon Alexa 这些面向终端用户的虚拟助理推出之前，Next IT 就已经开发了多款聊天机器人应用。但Next IT没有C端市场和行业巨头进行正面竞争，而是将产品定位在B端市场。他们先后为阿拉斯加航空公司开发了“Ask Jenn”，为美国铁路公司开发了“Ask Julie”，还曾为美国军方开发了“Sgt. Star”。

▼

致力于向用户反馈切实可行的结果

与巨头们博弈的C端市场最大的不同，在B端市场中的应用中要求智能虚拟助理能够向用户反馈切实可行的结果，即，智能虚拟助理更加需要通过语音的交互为用户提供辅助明智决策的信息（Actionable Intelligence），而实现这一目的，就要求开发者在特定的应用场景中积累更多的语义语料和场景数据。

根据关联上下文预测用户的真实意图

Next IT在2011年之后的研发重点主要集中在其涉猎的各种应用场景中向用户反馈切实可行结果这一方面。比如Next IT与2011年12月30日申请的专利Providing Variable Responses in a Virtual-Assistant Environment （US20130174034A1），该专利利用自然语言处理技术来识别用户表达的一个或多个概念（to identify one or more concepts expressed），基于识别的概念查询相关联的上下文以预测用户的多个意图，从中选择一个最可能贴近用户真实的意图作为输出的结果。

比如用户提出一个问题：“我可以在我的下一班机上升级我的座位分配吗？”，则虚拟助理会基于识别出的例如“升级”、“分配”、“座位”或“航班”等关键词去查询关联的上下文，比如用户的登录状态，用户类型，旅行历史，用户位置，用户访问设备类型，甚至当用户向虚拟助理提供查询时，网页中的光标位置等相关信息，给用户一个切实可行的方案，比如“是的，John，作为金牌客户，您有权进行座位升级，并且我已经提供了以下可能感兴趣的一些链接您…..”。

与专利US20130174034A1属于同一组合的，还包括例如虚拟助理采用自然语言对话处理技术来根据用户的要求更改行程或订单的专利US20120246081A1及虚拟助理接收到用户查询的响应时智能地模拟客服人员向用户提供咨询或应答服务专利US20180095565A1等。

将GUI和CUI相结合的专利技术

对话式服务（conversational service/commerce）是虚拟助理的核心特点，这使得人机交互的方式由图形化交互变为以对话作为交互方式（Conversational User Interface，简称CUI），更加解放了用户的双手和眼睛，但诚如前面所讲，受制于用户的发散而随机的各种需求，大多数虚拟助理并不能满足用户的真实期望。

Next IT并非像C端市场的玩家那样追求产品的酷炫效果而削弱对用户切实关心问题的理解能力，他们反而借助其他玩家极力摒弃的GUI界面让用户直观地了解设备是否误解了用户的语言输入，进而实现设备与用户准确有效地沟通。其专利US20130283168A1、专利US20160110071A1及US9223537B2（Conversation User Interface）都涉及GUI和CUI相结合的创新技术，Next IT将这些技术应用到其涉足的各种场景中，比如销售、医疗等。

在现实的应用中，要求设备需要理解用户的真实场景和真正需求后为用户做决策并反馈结果。为用户提供符合真实需求的可行性建议，就要求智能虚拟助理就得至少具备以下功能：

1.具备基于上下文对话的能力 (contextual conversation)
2.具备理解口语中的逻辑的能力 (logic understanding)
3.针对所有能理解的需求都具备履行的能力（full-fulfillment）

▼

在B端市场得到了迅速的发展

从Next IT历年披露的专利信息中可以看出，该公司的研发一直致力于实现上述功能，基于其开发的 Alme 软件平台的应用程序接口集合，切入特定的领域，比如医疗和航空，在这些领域积累用户数据和场景数据，依据设定的边界条件设计学习和训练的模型，为企业开发虚拟助理，并提供个性化的用户交互服务使得其在B端市场得到了迅速的发展。

2017年12月，Next IT被纳斯达克上市公司Verint收购，购买价格包括在收市时支付的近3000万美元的现金以及潜在的额外未来现金支付。Verint公司是 Actionable Intelligence解决方案的全球领导者，客户交互优化服务是该公司重要的业务板块，Verint收购Next IT也正是看中了Next IT在B端市场的技术积累和市场经验，当然还有Next IT历年来获得的专利资产。

Next IT自创业伊始，专注于将人工智能技术与海量事实用户服务请求数据相结合，让机器专注于帮助用户发现错误，并为用户提供切实可行的建议，在这一过程中，Next IT持续积累自己的专有技术和专利资产，这些专利的申请时机和技术紧密结合他们研发节奏和产品特点，在面对C端市场以及各种风口的巨大诱惑面前，能够心无旁骛坚持自己的战略和技术路线，对这创业公司而言是难能可贵的。

* 以上文字仅为促进讨论和交流，不构成法律意见或咨询建议。