悉尼和舊金山2021年4月22日 /美通社/ -- 近期(qi),澳(ao)鵬Appen與(yu)一(yi)家語音識別技術(shu)公(gong)司 -- MediaInterface達成合作(zuo),填補了(le)其關(guan)鍵的(de)數據空白,助力其實現快(kuai)速部署新市場(chang)。
語音識別技術在(zai)醫療領(ling)域的應用
幾年前,北(bei)京(jing)協和醫(yi)院曾(ceng)開展過(guo)一項關于(yu)文(wen)檔錄入工作量(liang)的(de)調研(yan)。結果顯示,我國(guo)超過(guo)40%的(de)醫(yi)生(sheng)每天(tian)在計算機前進(jin)行文(wen)字錄入的(de)時(shi)間(jian)約為4小時(shi),超過(guo)一半的(de)醫(yi)生(sheng)每天(tian)進(jin)行文(wen)字錄入的(de)時(shi)間(jian)占工作總(zong)時(shi)間(jian)的(de)40%。醫(yi)生(sheng)們(men)普遍對于(yu)提高(gao)病(bing)歷(li)錄入效率(lv)有著強烈需求。
MediaInterface是一(yi)家頗具代表性的語(yu)音識(shi)別技術公司(si)
語(yu)音識別(bie)技(ji)術是一(yi)種相對成熟的(de)解(jie)決方(fang)案。在(zai)(zai)許多歐美(mei)(mei)國家,語(yu)音識別(bie)技(ji)術在(zai)(zai)醫療領域(yu)的(de)應(ying)用已超過10年。近年來(lai),美(mei)(mei)國臨床中(zhong)語(yu)音識別(bie)錄入(ru)的(de)應(ying)用比(bi)例更(geng)是已近20%。MediaInterface便(bian)是其中(zhong)一(yi)家頗(po)具代表(biao)性的(de)語(yu)音識別(bie)技(ji)術公司。
更高效的醫療文檔工作流程
以德國為中心(xin)發散(san),MediaInterface已經為歐(ou)洲許多國家的醫(yi)療(liao)(liao)機構(gou)提供(gong)語音技術解(jie)決(jue)方(fang)案長(chang)達(da)20余年(nian)。如同它(ta)的名字(zi)一(yi)樣,其核心(xin)產品SpeaKING便是利(li)用語音識別(bie)AI技術支持醫(yi)療(liao)(liao)文(wen)檔的高(gao)效工具。目前,該產品已幫助600+家醫(yi)院、700+家醫(yi)療(liao)(liao)機構(gou)、75,000+名用戶實現(xian)速度更快(kuai)、質量(liang)更高(gao)的醫(yi)療(liao)(liao)文(wen)檔工作(zuo)流程。
憑(ping)借20多年來在(zai)歐洲(zhou)多個國(guo)(guo)家的成功經驗,MediaInterface希(xi)望將業務(wu)拓展(zhan)至法國(guo)(guo)。然而,在(zai)業務(wu)拓展(zhan)的過(guo)程中,他(ta)們(men)遇(yu)到(dao)了(le)法語數據資(zi)源不足(zu)的問題。
從德國到法國
盡管擁(yong)有(you)20余年的行(xing)業經驗,MediaInterface擁(yong)有(you)的法(fa)語(yu)(yu)數據卻(que)并不多。要(yao)想拓展法(fa)國市場,MediaInterface必須建立全(quan)面(mian)的法(fa)語(yu)(yu)詞(ci)匯(hui)基礎。他們迫切(qie)需(xu)要(yao)具有(you)高(gao)質(zhi)量語(yu)(yu)音轉錄功能(neng)的專業法(fa)語(yu)(yu)“詞(ci)典”。
這(zhe)本“詞典”中(zhong),最大的(de)(de)(de)(de)數據空(kong)(kong)白是患者健康信息中(zhong)經常引用的(de)(de)(de)(de)法語(yu)姓名(ming)和(he)地點。但這(zhe)些數據卻難(nan)以獲(huo)取:《歐(ou)洲通用數據保(bao)護(hu)條例》規(gui)定,可供收集的(de)(de)(de)(de)健康數據必(bi)須匿名(ming)處理,因此不包括人名(ming)和(he)地名(ming)。MediaInterface必(bi)須尋求專(zhuan)業的(de)(de)(de)(de)外部資(zi)源(yuan),在遵守當地數據法規(gui)的(de)(de)(de)(de)前提下,幫助他們(men)填補這(zhe)些重(zhong)要的(de)(de)(de)(de)數據空(kong)(kong)白。
Appen法(fa)語(yu)數據資(zi)源及時助力(li)MediaInterface拓展法(fa)國市場(chang)
MediaInterface產(chan)品(pin)(pin)經理Ines Wendler表示(shi):“我們(men)當(dang)時(shi)正在向(xiang)新市場拓展。盡管(guan)我們(men)擁(yong)有先進的(de)技術(shu)和軟件,但數(shu)據資源的(de)缺乏(fa)讓我們(men)的(de)產(chan)品(pin)(pin)難以(yi)在當(dang)地推行。Appen的(de)法語數(shu)據資源及時(shi)幫助(zhu)了(le)我們(men)。”
快速部署新市場
MediaInterface與澳鵬Appen結緣于2015年的(de)INTERSPEECH語音技術大會。此(ci)次法(fa)(fa)國(guo)市場的(de)拓(tuo)展(zhan)則促成了(le)雙方的(de)合作(zuo)。目前,MediaInterface已通過澳鵬獲取到約21,000個法(fa)(fa)國(guo)人(ren)名(ming)和14,000個法(fa)(fa)國(guo)地名(ming),從而填(tian)補了(le)最關鍵(jian)的(de)數據空白(bai)。
澳鵬數據集幫助MediaInterface開拓客戶群并改善數據質(zhi)量和客戶體驗
澳鵬Appen通過種類豐富的(de)(de)(de)OTS成品數(shu)據集助(zhu)力MediaInterface針對某(mou)一集中(zhong)需求的(de)(de)(de)產品開發,從而拓展到全新的(de)(de)(de)市場,并增強未來進入更多市場的(de)(de)(de)可能(neng)性(xing)。目前,MediaInterface已在法(fa)國(guo)(guo)全面覆蓋了醫療機構對基本口述語音識(shi)(shi)別的(de)(de)(de)需求,為法(fa)國(guo)(guo)客戶提(ti)供(gong)了較高的(de)(de)(de)可信度。憑借數(shu)據資源的(de)(de)(de)豐富,SpeaKING中(zhong)的(de)(de)(de)SmartLearning功能(neng)還可以讓用戶在其中(zhong)添加(jia)自己的(de)(de)(de)文本,以個性(xing)化現有詞匯,從而通過向基礎(chu)AI模型中(zhong)添加(jia)數(shu)據的(de)(de)(de)方式(shi)來提(ti)高語音識(shi)(shi)別的(de)(de)(de)效果。
就MediaInterface而(er)言,澳鵬(peng)數(shu)據集為(wei)其配(pei)備了工具,在(zai)開拓客戶群的(de)同時,亦改(gai)善了數(shu)據質量(liang)和(he)客戶體(ti)驗。不僅僅是(shi)MediaInterface,澳鵬(peng)Appen成品(pin)數(shu)據集已幫(bang)助(zhu)許多企業以更(geng)高的(de)產(chan)品(pin)準確性實現了快速的(de)部(bu)署。
澳鵬OTS成品數據集上新
澳鵬本次更新的OTS成品(pin)數據(ju)集*,包(bao)括人體運動和嬰兒啼哭聲,以(yi)及(ji)(ji)市場需求量(liang)高但通常難以(yi)獲得(de)的(de)語(yu)(yu)言(yan)(如阿拉(la)伯語(yu)(yu)、克羅地亞語(yu)(yu)、希臘語(yu)(yu)、匈(xiong)牙利語(yu)(yu)、泰語(yu)(yu)等(deng))的(de)腳本(ben)化語(yu)(yu)音和帶有可識別文本(ben)的(de)圖像。全新數(shu)(shu)據(ju)集的(de)加入使澳鵬Appen的(de)OTS數(shu)(shu)據(ju)集總(zong)數(shu)(shu)達到250+個,包(bao)括11,000+小時(shi)的(de)音頻、25,000+張圖像以(yi)及(ji)(ji)涵蓋(gai)80+種(zhong)語(yu)(yu)言(yan)及(ji)(ji)方言(yan)的(de)870萬+個單(dan)詞。
其中主要包括:
MediaInterface核(he)心產品SpeaKING是利用語音識別AI技術支持醫療文檔的高效工具
所有澳鵬Appen數據集都采用完全透(tou)明的方式進(jin)行(xing)開發,確保(bao)數據安全且合規(gui),從(cong)而助力高質量(liang)、負責(ze)任(ren)的AI部(bu)署。
*成(cheng)品數(shu)據(ju)(ju)(ju)集(ji)(也稱OTS數(shu)據(ju)(ju)(ju)集(ji))是一(yi)種高效(xiao)、低成(cheng)本的(de)工具,可通過高質量的(de)訓練數(shu)據(ju)(ju)(ju)快速啟動(dong)人(ren)工智(zhi)能或(huo)機器學(xue)習項目(mu)。OTS數(shu)據(ju)(ju)(ju)集(ji)通常的(de)交(jiao)付時(shi)間(jian)在一(yi)周(zhou)之內,而(er)全新的(de)數(shu)據(ju)(ju)(ju)集(ji)采集(ji)和標注項目(mu)根據(ju)(ju)(ju)其復雜(za)程度,則通常需(xu)要8到12周(zhou)的(de)交(jiao)付時(shi)間(jian)。與傳(chuan)統方法相(xiang)比,OTS數(shu)據(ju)(ju)(ju)集(ji)縮短了(le)實現價值的(de)時(shi)間(jian),并以較低的(de)總成(cheng)本提供(gong)了(le)對高質量數(shu)據(ju)(ju)(ju)的(de)使(shi)用權。 |