網頁正文自動抽取技術

基於視覺的正文抽取和網頁塊分析是完全模擬IE瀏覽器的顯示方式,對網頁進行解析。系統根據人類視覺原理,把網頁解析處理的結果,進行分塊。然後根據用戶需求,提取用戶需要的提取相關網頁塊的內容。
比如在競爭情報系統和自動新聞已經采編髮系統中,正文的提取。提取:標題、正文、時間等信息。

相關詞條

熱門詞條

聯絡我們