SmartSeg®
高精度中文分詞
分詞是中文信息處理的基礎,大部分中文文本處理系統都依賴分詞算法的結果,所以分詞的準確率和效率至關重要。中文的詞匯由于沒有西方詞匯之間的空格作為間隔,所以使用詞典來分詞往往需要解決消歧問題。除此之外,命名實體和新詞的識別也是分詞中的難點。
產品簡介
詞泰科技的SmartSeg® 采用最新的統計分詞模型。通過大規模的人工標注的語料庫作為訓練語料,SmartSeg®從中提取大量特征,并通過條件隨機場(Conditional Random Fields)等機器學習算法,自動對分詞模型進行整體的最優化訓練。而Viterbi解碼算法保證了分詞解碼的效率,從而在保證高準確度的同時具有極高的分詞速度。SmartSeg®對于新詞和命名實體識別的能力也非常突出,其各項評測性能指標達到了行業領先水準。
系統需求
- 最低配置: 單核 2.0 GHz CPU , 1 GB 內存.
- 推薦配置: 多核 2.0 GHz (或更好) CPU, 2 GB 內存.
- 支持的操作系統: Microsoft Windows (95, 98, XP, Vista, 7, 8, Server 2003, 2008)
- 運行環境: .Net framework 2.0 或更高
支持的語言
目前SmartSeg®支持中文
更多信息
如果您希望了解有關SmartSeg®的更多信息,請與我們聯系。