NLP創(chuàng)業(yè)公司概覽
時(shí)間:2023-03-15 10:16:02 | 來源:電子商務(wù)
時(shí)間:2023-03-15 10:16:02 來源:電子商務(wù)
最近閑來無事,想通過NLP相關(guān)的創(chuàng)業(yè)公司,了解一下NLP落地的實(shí)際情況和趨勢,同時(shí)也可以追蹤工業(yè)界的動(dòng)態(tài)。我直接根據(jù)CB Insights在2017和2018公布的AI100榜單,篩選出一些和NLP比較相關(guān)的公司(一定程度上,NLP是作為該公司的核心技術(shù),而不是輔助技術(shù)),然后對這些公司業(yè)務(wù)作個(gè)簡單的介紹,再根據(jù)他們所屬的領(lǐng)域分類。按照慣例,CB Insights應(yīng)該會(huì)在近期公布2019的榜單,到時(shí)候再進(jìn)行補(bǔ)充。
PS. 我本身對這些公司的業(yè)務(wù)沒有深入的了解,信息僅來源于CB Insights的報(bào)告和各公司官網(wǎng)。本文只是探索NLP應(yīng)用的場景,不對其他問題形成參考和建議(說得好像有人會(huì)信了我的邪,手動(dòng)狗頭)。CB Insights報(bào)告里面已被收購或上市的公司就沒列出來了,像百度的Kitt.ai(個(gè)性化喚醒詞),思科的MindMeld(對話AI),微軟的Semantic Machines(對話AI),有興趣的可以搜搜看(其實(shí)我就是懶)。另外,公司成立時(shí)間、地點(diǎn)、員工數(shù)等基本信息來源于Crunchbase。
AlphaSense
- 成立時(shí)間:2010
- 地點(diǎn):美國紐約
- 員工數(shù):101-250
- 總?cè)谫Y額:37.1M美元
- 網(wǎng)址:https://www.alpha-sense.com
AlphaSense通過從大量數(shù)據(jù)源,包括公司文件、文稿、新聞、華爾街研報(bào),為客戶高效地整理有價(jià)值的訊息。該公司的業(yè)務(wù)主要是針對企業(yè)客戶以及投資者,幫助他們從多源信息中提煉關(guān)鍵信息,指導(dǎo)決策和投資,即,信息優(yōu)勢是該公司給客戶帶來的核心利益。
Automat
- 成立時(shí)間:2016.1
- 地點(diǎn):加拿大蒙特利爾
- 員工數(shù):11-50
- 融資情況:A輪
- 總?cè)谫Y額:10.9M美元
- 網(wǎng)址:https://www.automat.ai/
相對于傳統(tǒng)的郵件營銷(就是你收到的各類產(chǎn)品廣告郵件),Automat提出了對話營銷(Conversation Marketing)的概念?;舅枷刖褪翘峁┥碳遗c每個(gè)客戶一對一交流、有針對性地推銷產(chǎn)品的能力。通過他們提供的對話即服務(wù)(Conversation as a Service),商家可以方便地將這種服務(wù)和當(dāng)前流行的即時(shí)通訊聊天APP(WhatsApp,Line,微信等)進(jìn)行對接,以觸及更多的用戶。他們提供了與歐萊雅合作的案例,該服務(wù)為歐萊雅的營銷帶來了顯著增長。
Chorus
- 成立時(shí)間:2015
- 地點(diǎn):美國舊金山
- 員工數(shù):51-100
- 融資情況:B輪
- 總?cè)谫Y額:55.3M美元
- 網(wǎng)址:https://www.chorus.ai
Chorus旨在理解并加強(qiáng)人們溝通的效率。其通過實(shí)時(shí)地記錄、總結(jié)、存儲(chǔ)人們的交流過程,以可視化的方式展現(xiàn)對整個(gè)交流過程分析的結(jié)果,幫助客戶了解哪些內(nèi)容會(huì)影響溝通交流的結(jié)果以改進(jìn)溝通的方式。一個(gè)典型的場景就是電話銷售,該公司團(tuán)隊(duì)分析了三百多萬個(gè)通話記錄(大部分是銷售電話),將他們的分析結(jié)果公布在公司的博客上,主要是介紹一些電話銷售的技巧,比如如何讓整個(gè)銷售流程順利進(jìn)行。
CloudMedx
- 成立時(shí)間:2015
- 地點(diǎn):美國帕洛阿爾托(舊金山附近)
- 員工數(shù):11-50
- 總?cè)谫Y額:5.3M美元
- 網(wǎng)址:http://www.cloudmedxhealth.com/
CloudMedx是一家提供醫(yī)療分析的公司。公司的業(yè)務(wù)流程,先是從穿戴設(shè)備、電子病例多個(gè)和病人相關(guān)的數(shù)據(jù)源收集收據(jù),然后利用NLP和機(jī)器學(xué)習(xí)技術(shù),結(jié)合AI模型生成診斷結(jié)果和后續(xù)操作建議,提升病人風(fēng)險(xiǎn)評估和診斷文檔整理的效率。他們的平臺(tái)是構(gòu)建于一個(gè)全面的,且規(guī)模不斷增長的醫(yī)學(xué)知識(shí)圖譜之上的。知識(shí)和本體的引入,增強(qiáng)了整個(gè)系統(tǒng)的能力。
http://Cortical.io
- 成立時(shí)間:2011.11.1
- 地點(diǎn):奧地利維也納
- 員工數(shù):11-50
- 總?cè)谫Y額:6.3M美元
- 網(wǎng)址:https://www.cortical.io/
這個(gè)公司和NLP的關(guān)系更直接,他們提供一系列NLU解決方案。受到近期關(guān)于大腦如何處理信息的研究的啟發(fā),Cortical開發(fā)了Retina引擎,其能夠?qū)⒄Z言轉(zhuǎn)為語義指紋(其實(shí)就是信息指紋,只不過是能夠顯式地捕獲文本語義的信息指紋)。通過計(jì)算指紋之間的重合度來比較兩段文本之間的語義相關(guān)度。他們聲稱,該NLU系統(tǒng)有別于現(xiàn)在主流的AI,其能夠輕松地完成任何語言、領(lǐng)域的定制化。而算法內(nèi)在的差別使得Cortical可以解決許多開放的NLU問題,比如在TB級別非結(jié)構(gòu)化數(shù)據(jù)上完成基于含義的過濾,社交媒體實(shí)時(shí)話題檢測,以及,在百萬文檔規(guī)模上進(jìn)行跨語言的語義搜索。個(gè)人感覺這個(gè)公司挺有意思的,可以深入了解一下他們的業(yè)務(wù)和技術(shù)。官網(wǎng)提供了一些demo,也可以申請免費(fèi)的API試用。
Digital Reasoning
- 成立時(shí)間:2000(老牌?。?/li>
- 地點(diǎn):美國富蘭克林
- 員工數(shù):101-250
- 融資情況:D輪
- 總?cè)谫Y額:104M美元
- 網(wǎng)址:https://digitalreasoning.com/
Digital Reasoning(DR)在認(rèn)知計(jì)算方面是個(gè)領(lǐng)導(dǎo)者。業(yè)務(wù)有點(diǎn)類似AlphaSense,主要為國防情報(bào)機(jī)構(gòu)、司法機(jī)構(gòu)、金融機(jī)構(gòu)和醫(yī)療保健組織提供服務(wù)。和AlphaSense不同的是,DR利用人的書面和口語形式的溝通交流數(shù)據(jù),來挖掘有價(jià)值的信息,也就是Human-centric Insights,為客戶找到潛在的風(fēng)險(xiǎn)或者機(jī)會(huì)。更具體地形式是對各類實(shí)體,比如人、地點(diǎn),和他們之間的關(guān)系進(jìn)行建模和挖掘。
Insight Engines
- 成立時(shí)間:2015
- 地點(diǎn):美國舊金山
- 員工數(shù):11-50
- 融資情況:A輪
- 總?cè)谫Y額:15.8M美元
- 網(wǎng)址:https://insightengines.com/
這家公司的業(yè)務(wù)面向企業(yè)客戶,提供智能搜索助手(Insight Engines也稱之為natural language search engine)。有點(diǎn)類似QA系統(tǒng),用戶以自然語言形式的問題作為輸入,該系統(tǒng)以客戶公司內(nèi)部數(shù)據(jù)(machine generated data)作為搜索源,將處理得到的答案返回給用戶(不僅僅是文本答案,還包括圖表之類的可視化展示)。通過這種方式,來提高企業(yè)客戶分析海量數(shù)據(jù)的效率。官網(wǎng)給出了該產(chǎn)品的介紹視頻。
Kasisto
- 成立時(shí)間:2013
- 地點(diǎn):美國紐約
- 員工數(shù):51-100
- 融資情況:B輪
- 總?cè)谫Y額:28.5M美元
- 網(wǎng)址:https://kasisto.com/
Kasisto為金融領(lǐng)域的客戶提供一個(gè)名為KAI的AI對話平臺(tái)(主要為銀行及其客戶提供服務(wù))。該Bot可以對個(gè)人的支付、交易及個(gè)人財(cái)務(wù)進(jìn)行管理。Bot在交流過程中可以處理非正式用語、話題快速轉(zhuǎn)變以及打斷等情況。官網(wǎng)首頁有demo示例。
Kyndi
- 成立時(shí)間:2014.6.5
- 地點(diǎn):美國加州
- 員工數(shù):11-50
- 融資情況:B輪
- 總?cè)谫Y額:9.6M美元
- 網(wǎng)址:https://kyndi.com/
Kyndi旨在為政府部門、金融機(jī)構(gòu)和醫(yī)療保健機(jī)構(gòu)搭建可解釋的AI平臺(tái),輔助上述機(jī)構(gòu)人員進(jìn)行決策。Kyndi指出可解釋性是他們產(chǎn)品和解決方案的核心。Kyndi也順便懟了一把DL,DL是個(gè)黑盒子,不能用于上述等受管轄行業(yè)。因?yàn)檫@些組織的任何決策必須是可解釋的。不過,他們應(yīng)該說的是,這個(gè)最終的決策是可解釋或者可理解的。因?yàn)樗麄冏约阂蔡岬?,利用NLP來做詞性標(biāo)注,語法樹生成,命名實(shí)體識(shí)別,語義相似度計(jì)算還有關(guān)系抽取,然后用知識(shí)圖譜將這些數(shù)據(jù)組織起來,所以,按照現(xiàn)在NLP的發(fā)展趨勢,肯定是繞不開DL的。
Mobvoi(出門問問)
- 成立時(shí)間:2012
- 地點(diǎn):中國北京
- 員工數(shù):251-500
- 融資情況:D輪
- 總?cè)谫Y額:252.7M美元
- 網(wǎng)址:https://www.chumenwenwen.com/
出門問問融資快趕上之前介紹的公司的總和(CB Insights 兩次上榜)。出門問問主要以語音交互為主,是個(gè)軟硬結(jié)合的公司。它的實(shí)體產(chǎn)品包括智能手表、智能耳機(jī)、智能后視鏡、智能音箱等。出門問問的核心技術(shù)涉及高識(shí)別率的中文ASR,語義分析、垂直搜索、語音合成。雖說是谷歌大佬直接投資的公司,但不知道產(chǎn)品到底怎么樣,貌似還和小米有合作。
mya
- 成立時(shí)間:2011
- 地點(diǎn):美國舊金山
- 員工數(shù):11-50
- 融資情況:B輪
- 總?cè)谫Y額:32.4M美元
- 網(wǎng)址:https://hiremya.com/
mya的業(yè)務(wù)是利用對話AI來幫助企業(yè)進(jìn)行招聘工作。通過匹配和預(yù)測模型從海量候選人中進(jìn)行篩選,自動(dòng)地安排面試,讓招聘人員優(yōu)先面試最可能成功的候選人。mya系統(tǒng)通過語義解析、命名實(shí)體識(shí)別和多意圖分類來從候選人對話中獲取有意義的信息,并利用動(dòng)態(tài)對話管理技術(shù)來維護(hù)對話過程或者引導(dǎo)對話。mya的解決方案提升了企業(yè)招聘的效率。
Narrative Science
- 成立時(shí)間:2010
- 地點(diǎn):美國芝加哥
- 員工數(shù):51-100
- 融資情況:D輪
- 總?cè)谫Y額:43.4M美元
- 網(wǎng)址:https://narrativescience.com/
這家公司比較意思,為企業(yè)提供NLG服務(wù),簡直“企如其名”(CB Insights 兩次上榜)。具體來說,就是通過對多源數(shù)據(jù)進(jìn)行分析,找到有價(jià)值和意義的信息,然后將其轉(zhuǎn)為人類可理解的書面語言。單純從技術(shù)上而言,有點(diǎn)類似多文檔摘要。但核心問題是如何抽取用戶關(guān)心的信息,并以流暢的語言正確傳遞這些信息。
Snips
- 成立時(shí)間:2013
- 地點(diǎn):法國巴黎
- 員工數(shù):51-100
- 總?cè)谫Y額:24.7M美元
- 網(wǎng)址:https://snips.ai/
Snips為客戶提供可運(yùn)行于各種設(shè)備及各種平臺(tái)上的語音助手。該語音助手完全是在本地運(yùn)行(不需要網(wǎng)絡(luò)連接),沒有服務(wù)器(用戶數(shù)據(jù)都在本地)。也就是說,Snips提供語音助手SDK,其支持語音或文本自然語言查詢、魯棒的查詢理解,也包含多種語言下多領(lǐng)域預(yù)訓(xùn)練模型。個(gè)人覺得就是智能音箱的定制化解決方案了,很多特性是用你自己的數(shù)據(jù)進(jìn)行訓(xùn)練,按照他們的說法,也不會(huì)收集你的數(shù)據(jù)。所以,技術(shù)涉及比較廣,整個(gè)流程,包含從個(gè)性化喚醒詞(Wake Word),ASR,NLU,到TTS等等。CB Insights在報(bào)告中收錄這個(gè)公司的時(shí)候,他們一共有41個(gè)人,其中18個(gè)人搞機(jī)器學(xué)習(xí),14個(gè)人負(fù)責(zé)工程實(shí)現(xiàn)。
https://www.zhihu.com/video/1060497701027876864
Textio
- 成立時(shí)間:2014.9.25
- 地點(diǎn):美國西雅圖
- 員工數(shù):51-100
- 融資情況:B輪
- 總?cè)谫Y額:29.5M美元
- 網(wǎng)址:https://textio.com/
這家公司的業(yè)務(wù)一個(gè)詞就可以總結(jié)了:Polish。再具體一點(diǎn)就是polish your writing。Textio為客戶提供文筆潤色的服務(wù)(CB Insights 兩次上榜)。有點(diǎn)類似Grammarly,不過Grammarly的功能主要是指出文章中的語法問題。Textio目前主要關(guān)注招聘領(lǐng)域,和上面介紹的mya一樣。簡單來說,就是幫助企業(yè)調(diào)整JD內(nèi)容,以吸引更多符合要求的應(yīng)聘者。單是這么細(xì)分的一個(gè)業(yè)務(wù)就能融到近三千萬美金。。。真是。。。很有想象空間了。。
Twiggle
- 成立時(shí)間:2014
- 地點(diǎn):以色列特拉維夫
- 員工數(shù):11-50
- 融資情況:B輪
- 總?cè)谫Y額:35M美元
- 網(wǎng)址:https://twiggle.com/
Twiggle利用ML、NLP、Data Mining等技術(shù)為電商所面臨的一些重大挑戰(zhàn)提供解決方案。Twiggle旨在改變?nèi)藗兯阉魃唐泛唾徫锏姆绞?。看了一下官網(wǎng)的demo,他們能夠支持用戶以自然語言的方式,在多個(gè)維度下進(jìn)行搜索,比如“500塊以下的帶有長袖的黑色短裙”。個(gè)人覺得,相對于語義解析,難點(diǎn)更多在于如何構(gòu)建健全的商品屬性信息,以及怎么把語義元素和商品屬性元素進(jìn)行更好的匹配。根據(jù)Twiggle發(fā)布的高級NLP工程師招聘JD,發(fā)現(xiàn)他們的系統(tǒng)是由知識(shí)圖譜來進(jìn)行支撐。其實(shí)也比較好理解,在電商垂直領(lǐng)域,天然地適合用KG來進(jìn)行商品建模和管理。淘寶也有自己的商品知識(shí)圖譜,我隨手在淘寶試了一下,搜索“500塊以下的帶有長袖的黑色短裙”,根據(jù)搜索結(jié)果來看,淘寶貌似是支持這種搜索模式的。我又試著搜索“男的穿的,800塊以下的,白色大碼羽絨服”,返回“沒有找到相關(guān)寶貝”,但列出了與查詢所包含的關(guān)鍵詞相關(guān)的一些商品。雖然不知道淘寶到底有沒有利用類似Twiggle的技術(shù),但個(gè)人認(rèn)為這是一個(gè)很好的探索方向。畢竟淘寶的商品知識(shí)圖譜已經(jīng)建立起來了,通過語義解析和商品匹配等手段,為消費(fèi)者提供更細(xì)致化的商品搜索服務(wù),讓消費(fèi)者高效率地剁手,何樂而不為呢?
將上述公司按照業(yè)務(wù)領(lǐng)域進(jìn)行分類:
- 跨行業(yè)應(yīng)用:AlphaSense、Narrative Science、出門問問、Kyndi、Insight Engines、http://Cortical.io、Digital Reasoning、Snips
- 銷售:Automat、Chorus
- 醫(yī)療健康:CloudMedx
- 金融科技:Kasisto
- 人力資源技術(shù):mya、Textio
- 商業(yè):Twiggle
必須承認(rèn),這次調(diào)研十分粗略,數(shù)據(jù)來源局限于CB Insights的年度報(bào)告。不過考慮到很多媒體都引用CB Insights的報(bào)告,那么我就假設(shè)上榜的企業(yè)具有相當(dāng)?shù)拇硇?,可以在一定程度上反映NLP工業(yè)落地的現(xiàn)狀和趨勢。另外,這次調(diào)研并沒有覆蓋CB Insights報(bào)告中所有NLP相關(guān)的企業(yè),一方面,我篩選的方式比較粗暴(直接看介紹是否包含language關(guān)鍵詞,再排除),并沒有細(xì)看所有上榜的企業(yè);另一方面,上面羅列的企業(yè)大致能概括NLP落地的場景和領(lǐng)域。
上面2/3(10/15)的公司是在2012年后成立的,整體比較符合DL發(fā)展的趨勢。新技術(shù)的出現(xiàn)、成熟必定會(huì)催生出一批企業(yè)。2012年之前成立的企業(yè),尤其是2000年成立的Digital Reasoning,也許側(cè)面反映了行業(yè)的真實(shí)需求,并不是由于AI的熱潮,大家一拍腦袋,沒有需求創(chuàng)造需求也要上,而是市場本身存在這樣的需求或者說行業(yè)痛點(diǎn)。當(dāng)然,我也不是說后面新生的業(yè)務(wù)是扯蛋。受限于技術(shù),以前很多場景不能被滿足,但隨著技術(shù)的發(fā)展和成熟,誕生新的業(yè)務(wù)也很正常,這也是開拓者干的事。至于效果到底如何,只有交給時(shí)間來檢驗(yàn)了。
最后提一句,Crunchbase這個(gè)網(wǎng)站確實(shí)好用,企業(yè)的基本信息全不說,還能通過關(guān)鍵詞來搜索公司。比如,你可以指定NLP來查找相關(guān)企業(yè)。不過這是高級功能,要會(huì)員才能用,348刀一年。如果想比較全面地了解一個(gè)行業(yè),或者某種技術(shù)的落地情況,這應(yīng)該是個(gè)不錯(cuò)的工具。