必威电竞|足球世界杯竞猜平台

靈云
來源:互聯網

靈云 是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數字設備的網絡云服務,讓人機交互像人與人溝通一樣的簡單自然!

簡介

靈云是一種可以用語音、手寫、拍照,手勢,將來甚至可使用腦波識別等智能手段來操作、感知手機、計算機等數字設備的網絡云服務,讓人機交互像人與人溝通一樣的簡單自然!靈云由北京捷通華聲語音技術有限公司創造推出,是全球第一個感知云!

靈云平臺是基于云計算技術和分布式存儲技術,將TTS、ASR、OCR、 HWR、MT等HCI技術全面整合的綜合智能云服務平臺。

通過移動互聯網、互聯網隨時隨地享受靈云為您提供的“聽、說、讀、寫、譯……”等全方位的智能人機交互技術服務。

平臺技術

靈云所提供的HCI技術可以為人與機器之間的交流,提供更加智能和人性化的操控方式,改變原有的通過鼠標和鍵盤,并以眼睛為主要操控手段的控制方式,這是繼微軟推出windows開創視窗時代,蘋果公司推出IPhone開創觸控時代之后,又一個全新的智能人機交互時代的來臨。

在這個嶄新的時代,人們操控數字設備的方式得到了革命性的改變,鍵盤鼠標不再是唯一的交互與控制方式,以語音、手寫為代表的人機交互技術將逐漸取代鍵盤和鼠標在互聯網時代的絕對地位,作為獲取信息最重要的人體器官——眼睛,將得到前所未有的解放。人們可以通過語音、手寫來完成相應的控制工作,眼睛將會獲得更多的信息,從而讓設備產生更大的生產力,帶來更大的娛樂價值和學習價值。

靈云使用了全球最好的HCI技術,并將之按照人類最自然的方式,以云+端的方式提供給用戶。為終端用戶提供HCI技術云服務,包括語音合成云服務(TTS)、手寫識別云服務(HWR)、文字識別云服務(OCR)、語音識別云服務(ASR)、自動翻譯云服務(MT)等。

靈云是一個應用于互聯網和移動互聯網的HCI技術云服務平臺,其主要目標是:

1) 實現可面向互聯網及移動2G/3G網絡提供HCI云服務的服務器,在捷通華聲現有技術條件的基礎上為移動終端應用程序提供多路并發的語音合成、手寫識別、文字識別功能,通過架設在互聯網的云端服務器,用戶可以隨時隨地獲得高質量的HCI技術云服務;

2) 實現基于移動終端以及桌面平臺的HCI技術應用客戶端,提供統一的HCI技術應用開發接口,通過該接口用戶可以方便、快速地開發語音應用;同時,靈云也將開放一些基于移動以及桌面平臺的HCI技術應用,用于展示靈云平臺的功能和使用方法,讓用戶直接體驗到最新HCI技術的魅力。

靈云提供了架構于互聯網的HCI技術云服務,以及一套移動互聯網HCI技術解決方案、應用示例,把HCI技術服務的應用范圍拓寬到移動互聯網領域,為HCI技術服務產品走向移動互聯網市場開辟全新的應用模式。

靈云系統采用分布式架構,可以滿足行業級應用的高可靠性、高可用性要求。針對傳統HCI技術應用集成開發困難,業務設計繁瑣的問題,靈云產品大大簡化了集成開發和業務開發的復雜度,為系統集成人員和業務開發人員提供了便捷、高效的開發環境

“靈云”平臺的云服務帶來的一個重大變革是從以設備為中心轉向以技術服務為中心。硬件的過時,應用軟件的過時,在云上都不再是一個問題,只要有互聯網或移動互聯網,就可以享受到多種多樣、高質量、免更新打擾和個性化的HCI服務。現有的“靈云”平臺支持TTS(語音合成)、ASR(語音識別)、HWR(手寫識別)、OCR(圖像識別)、失明(自然語言處理)等多項HCI技術,并在持續更新性能和添加其他的功能。

“靈云”是為用戶提供人機交互智能人機交互服務的平臺,它拉近了用戶與機器之間的距離,簡化了用戶獲取信息的方式。在互聯網已經普及的今天,“靈云”更將滲透到每一個角落。想讓機器與人溝通變得更加靈活、自然,“靈云”便是最好、最適合用戶的選擇。“靈云”讓人的五官感知從10米以內延伸到整個世界!

系統架構

靈云平臺由平臺分布式服務節點、業務運營支撐系統、開發者社區組成。基本架構圖如下所示:

1.分布式服務節點:

物理架構

隨時隨地享受靈云為您提供的“聽、說、讀、寫、意……”等全方位的智能人機交互技術服務。

特點

一站式解決

靈云平臺是一個綜合性的智能人機交互云服務平臺,可以提供TTS、ASR、HWR、OCR、NLP等多種智能人機交互技術服務,使用者可以在靈云同時獲得多項服務支撐,一站式解決了需要到不同智能人機交互技術提供商獲取服務的繁瑣過程,讓智能人機交互技術簡單化,實用化。

能力介紹

TTS(語音合成)技術

捷通華聲的TTS技術在國內處于領先水平,產品市場占有率達50%,金融行業市場占有率達80%,并且在高鐵各站點、奧運會、世博會等多個大型項目中得到成功應用。

捷通華聲TTS可以提供中文引擎、英文引擎,以及其他語種引擎以及提供通過大規模錄音數據的處理而形成的語音數據庫。

ASR(語音識別)技術

語音識別,就是讓機器通過分析和理解過程把語音信號轉變為相應的文本或命令的尖端技術。語音識別是一門交叉學科,所涉及的領域包括:信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。語音識別技術語音合成技術一同成為實現人機語音通信,建立有聽和講能力的語音系統所必需的兩項關鍵技術。

捷通華聲ASR核心引擎是針對特定語言的識別軟件模塊,該軟件模塊是整個ASR軟件的核心模塊。核心模塊接收其他模塊的設置,并根據設置內容對語音數據進行識別,并將識別結果列表返回給調用模塊。返回的識別結果列表,包含一組識別結果--識別信心值對,以供調用模塊使用。

OCR(光學字符識別)技術

OCR(光學字符識別),是通過圖像處理和模式識別技術對光學的字符進行識別的意思,是自動識別技術研究和應用領域中的一個重要方面。OCR主要是指文字識別軟件,它是一種能夠將文字自動識別并錄入的軟件技術

捷通華聲OCR核心引擎是針對特定語言的識別軟件模塊,該軟件模塊是整個軟件的核心模塊。核心模塊接收其他模塊的設置,并根據設置內容對文字圖片數據進行識別,并將識別結果列表返回給調用模塊。

HWR(手寫識別)技術

手寫識別,是指將在手寫設備上書寫時產生的有序軌跡信息化轉化為漢字內碼的過程,實際上是手寫軌跡的坐標序列到漢字的內碼的一個映射過程。

捷通華聲HWR以先進的識別算法、多核融合技術、大容量字典裁減壓縮技術、高性能字符切割算法和語言模型技術為基礎,是一種能夠在任何時間、任何地點,向任何人實時、準確地提供手寫識別服務的高效便捷手段,非常符合信息時代動態更新和個性化查詢的需求。

NLU(自然語言處理)技術

自然語言處理(Natural Language Understanding,簡稱NLU)技術,涵蓋領域非常廣泛,包括句子檢測,分詞,詞性標注,句法分析,文本分類/聚類,文字角度,信息抽取/自動摘要,機器翻譯,自動問答,文本生成等多個領域。

捷通華聲利用多年來在語音語義數據和算法方面的積累,推出了自己的自然語言處理技術,并適時推出了利用自然語言處理技術的智能客服、智能意圖控制等產品。這些產品在市場上得到了廣泛應用,業務涉及通訊、政府、電子商務、智能家電和汽車等行業,在智能人機交互(文本、語音等)領域處于行業領先地位。

參考資料 >

生活家百科家居網