黑馬校對

黑馬校對

黑馬校對V21是北京黑馬飛騰科技有限公司全力開發的新一代校對系統,榮獲“中國優秀軟體”終身稱號並且通過了中國版協校委會的實測鑑定。內含S2版、PS版、Word版、WPS版、小樣版、飛騰外掛程式版和PDF外掛程式版等9個全新的校對界面,採用超大規模詞庫和重點詞監控等先進的校對計算技術,在校對質量、校對功能和易用性等方面都有了飛躍性的提高,達到了當前電腦校對軟體發展的最高水平,智慧型技術居於國際領先水平。

黑馬校對V21的研製基於覆蓋社會科學和自然科學各領域的10000億字漢語語料的分析,採用國際計算語言先進的語法分析和語料庫統計相結合的方法,具有漢語切分技術、漢語語法分析技術、漢語依存關係分析技術等 優秀的中文智慧型技術。內嵌79個專業詞庫、8000萬條專業辭彙、600萬條錯誤核心庫,查錯準確率和校對效率已經達到一個嶄新的高度。

支持各種主流文字處理和排版系統的檔案格式,支持各種專業文稿的校對。 黑馬校對系統是國內市場上占有率最高、實用性最強的專業校對軟體,為各類文稿的校對提供最佳解決方案。

全國已經有98%以上的出版社、近萬家的報社雜誌社、印刷企業、圖書公司和機關辦公等單位和個人使用黑馬校對系統。

基本介紹

版本,功能特點,校對功能,8000萬條專業詞庫,校對技術,依據標準,用戶詞庫,出版工具,技術原理,錯誤類型,

版本

單機版
多機版
限字版
單機版配有一個硬體加密鎖,安裝和使用時必須插鎖。不限制固定電腦安裝,是黑馬校對用戶群最多的版本。
單機版、多機版和限字版在校對功能上都是完全相同的。單機版、限字版同時只能在一台電腦上使用,而多機版可以多機同時使用
多機版是一個多用戶優惠版本,授權在一個單位內部使用,可以多人同時使用。多機版採用“母鎖+子鎖”的方式,即一個母鎖(側邊橘紅色)用於安裝,數量為授權台數的多個子鎖(側邊深藍色)用於使用。多機版在安裝時不限制安裝台數、安裝次數,使用時插上子鎖即可。
限字版是專門為期刊用戶開發的校對軟體。功能與單機版完全一樣,只不過累計校對字數限制在800萬字。字數用完後交少許費用可補充800萬字。補充字數時,若有新版,可免費升級到新版。

功能特點

校對功能

可以校對大部分中文錯別字、多字、少字、人名、地名、英文(單詞拼寫)、部分成對標點、科技計量、重句、異形詞、也作、曾用詞等各類錯誤。
校對大部分領導人姓名、職務和領導人排序錯誤。
校對大部分涉及台灣和其他敏感的政治性錯誤。
即時更新的、可自定義的領導人職務庫。
直接嵌入在Acrobat中校對PDF檔案。可把校對標記轉換成注釋結果,便於他人查看。
直接嵌入在Word、WPS中,編輯和校對相結合。
直接嵌入在飛騰系統中,排版、校對相結合。
支持Acrobat6.0~DC專業版;支持Office2000~2016版;支持WPS 2007~2016版;支持飛騰3.1~5.4版;支持飛翔2012~7。

8000萬條專業詞庫

首屈一指的大規模專業詞庫,專業詞庫辭彙量超過8000萬條,包括物理、數學、機械、紡織、氣象、歷史、考古、文物、交通、郵電、環境、農林牧漁、化學、石化、冶金、煤炭、建築、水利、圖書、印刷、醫學、生物、心理、經濟、證券、會計、財政、審計、電腦、電子、電力、新聞、政治、哲學、教育、少兒、文學、戲曲、電影、廣電、法律、宗教、民族、軍事、航空、地理、地質等79個專業詞庫。覆蓋1000億字高質量語料。符合全國科學技術名詞審定委員會的標準。

校對技術

根據需求定製重點詞監控詞庫,能夠準確快速地校對出所有與重點詞相似的錯誤,支持大容量的重點詞監控庫。特別適合於檢查領導人姓名、單位名稱、地名以及涉及中央重要精神的詞語等。

依據標準

⑴ 《現代漢語詞典》第7版 (商務印書館
⑵ 全國科學技術名詞審定委員會審定的各科科技名詞全書
⑶ 《中國人名地名大辭典》
⑷ 《第一批異形詞整理表說明》 (語文出版社) 國家語委2002年3月頒布
⑸ 《辭海》1999年版 (上海辭書出版社
⑹ 《中國成語大詞典》 (上海辭書出版社)
⑺ 《使用語言文字規範指南》 (上海辭書出版社)
⑻ 《外國地名譯名手冊》(中型本) 中國地名委員會編 (商務印書館)
⑼ 《英語姓名譯名手冊》第四版 新華通訊譯名資料組 編 (商務印書館)

用戶詞庫

自由定義用戶庫、錯誤庫、重點詞監控庫、敏感庫、建議庫、領導人職務庫和排序庫等詞庫,量身打造校對標準。可以自由掛接外來詞庫。

出版工具

S2版可同步校對大樣和小樣檔案,能夠直接對照大樣檔案無損修改小樣檔案。
方便實用的生成勘誤表功能。
強大的批量查找功能,輔助校對和建立索引。
句庫匹配,輕鬆校對文中引語是否與原句匹配。
高效的提取生詞功能,輕鬆擴建用戶詞庫。
先進的大樣轉文本和小樣排版符號剝離工具。
嚴格審定的大型成語查詢庫和各類知識庫。

技術原理

1. 正向查錯
依靠語言模型來進行漢語依存關係分析 ,也就是對大量分類語料中的上下文和語句關係進行量化的統計、分析、提煉,並採用高倍信息壓縮、快速檢索、漢字高精度快速切分等先進技術 來生成語言模型和依存分析算法。
語言模型中知識庫詞條達4800萬條之多。
為提煉不同領域的文字特徵,黑馬分析處理了涵蓋自然科學、社會科學十大分支的300億漢語語料,同時鑒於中文的複雜性,為了提高語言模版的準確性和減少信息垃圾,我們每年投入30餘名數據處理人員對計算機智慧型分析結果進行人工核查。
2. 反向查錯
黑馬公司長期堅持不懈地大量收集各種常見錯誤,包括:寫作人員似是而非錯誤、五筆字型錄入人員常見錯誤、拼音錄入常見錯誤、OCR識別有規律的錯誤、各專業廢除詞條、不規範科技計量單位、國家語委確定的非規範詞條 、各類政治性錯誤等。
3. 從實際需求出發,增強校對功能
黑馬校對軟體不僅在核心技術上保持著領先地位,而且還針對廣大用戶的實際使用地改進版本,擴大軟體的適應性,使其更具實用價值。
黑馬校對系統的早期版本可以校對各種排版格式的小樣檔案,後來為方便校對人員對稿,增加了把大樣檔案轉換成檔案檔案,保留頁碼信息的功能。後來,黑馬公司研製出軟體RIP技術,開發了可以直接顯示並校對大樣檔案的S2版和PS版。為了方便編輯、排版人員的校對和修改,開發出了嵌入到Word中校對的Word版、嵌入到WPS中的WPS版、嵌入到Acrobat中的PDF版和嵌入方正飛騰等排版系統的飛騰外掛程式版。

錯誤類型

黑馬校對V21版內含800萬條錯誤規則庫和8000萬條專業庫,具有強大的查錯能力,能夠精確校對政治性問題(領導人姓名、職務、排序,台灣問題,敏感詞語等)、中文(錯別字、少字、多字、詞語搭配和部分語法語義、異形詞和繁體字、“也作”和曾用詞、知識性錯誤、人名、地名等各種錯誤)、英文拼寫、標點、數字、科技計量單位、重句等各種錯誤,部分校對界面(S2版)還可以校對目錄、標題和序號等錯誤。
下面列舉一些黑馬校對可以檢查的錯誤類型(括弧外為錯誤詞條):
序號
錯誤類型
錯誤樣本
1
領導人姓名、職務搭配、排序錯誤
國家領導人的姓名錯誤,職務姓名搭配錯誤,以及先後排序錯誤等。
2
涉及台灣等的政治性問題
把台灣當成國家看待,和其他有關規定不允許的政治性錯誤。
3
其他敏感的政治性問題
宗教問題,敏感辭彙等。
4
拼音類錯別字
【拼音類錯誤】:
登計費(正:登記費);的台蘚(正:的苔蘚);兩隻槍(正:兩支槍);
投名壯(正:投名狀);邁卡錫(正:麥卡錫);易拉灌(正:易拉罐);
不在心煩(正:不再心煩);調節選鈕(正:調節旋鈕);
藍球賽場(正:籃球賽場);旅客需知(正:旅客須知);
十分煩重(正:十分繁重);無可挑替(正:無可挑剔);
形式微秒(正:形式微妙);巡行飛彈(正:巡航飛彈);
一幅楹聯(正:一副楹聯);一副油畫(正:一幅油畫);
一擊悶棍(正:一記悶棍);占了上峰(正:占了上風);
迅雷不急掩耳(正:迅雷不及掩耳);挾天子已令諸侯(正:挾天子以令諸侯);
人面桃花相應紅(正:人面桃花相映紅);
5
字形類錯別字
【字形類錯誤】:
抱括(正:包括);笫四(正:第四);
大鹹價(正:大減價);負責表(正:負債表);
摸不者(正:摸不著);字盂德(正:字孟德);
愛菅閒事(正:愛管閒事);巴彥卓爾(正:巴彥淖爾);
瓜瓜墜地(正:呱呱墜地);卡巴斯其(正:卡巴斯基);
兩個波型(正:兩個波形);聲名遠場(正:聲名遠揚);
展觀風采(正:展現風采);大漢口文化(正:大汶口文化);
迴旋自治區(正:回族自治區);客戶瑞生成(正:客戶端生成);
有機化台物(正:有機化合物);阿爾及尼亞(正:阿爾及利亞);
莫定了基礎(正:奠定了基礎);條件效成熟(正:條件較成熟);
世界人大奇景(正:世界八大奇景);給子行政處分(正:給予行政處分);
興隆街居委公(正:興隆街居委會);走了很多地萬(正:走了很多地方);
6
成語錯誤
【成語錯誤】:
百轉乾回(正:百轉千回); 暴斂天物(正:暴殄天物);
篳路籃縷(正:篳路藍縷); 彪炳千古(正:彪炳千古);
綺旎風光(正:旖旎風光); 千斤買鄰(正:千金買鄰);
權益之計(正:權宜之計); 神態自苦(正:神態自若);
水滴石川(正:水滴石穿); 四海生平(正:四海昇平);
他山之後(正:他山之石); 貪贓王法(正:貪贓枉法);
一蹴不振(正:一蹶不振); 一丘之豹(正:一丘之貉);
肄意妄為(正:肆意妄為); 鄭重其是(正:鄭重其事);
捉襟見紂(正:捉襟見肘); 自相茅盾(正:自相矛盾);
7
少字錯誤
【少字】:
成本管研究(正:成本管理研究); 國家安全員會(正:國家安全委員會);
馬克列寧主義(正:馬克思列寧主義);
8
多字錯誤
【多字】:
其實是是對(正:其實是對); 它的的功能(正:它的功能);
放射性元元素(正:放射性元素); 統計局統計局(正:統計局);
9
錯位錯誤
【錯位】:
熱鬧場的面(正:熱鬧的場面); 讓大人跌眼鏡(正:讓人大跌眼鏡);
美國小總統布希(正:美國總統小布希);
10
詞語搭配錯誤
【詞語搭配錯誤】:
他的丈夫(正:她的丈夫);冰雪熔化(正:冰雪融化);
記念勝利(正:紀念勝利);精減機構(正:精簡機構);
清楚毒素(正:清除毒素);心理沒底(正:心裡沒底);
危急人體健康(正:危害人體健康);
消費者想賣什麼(正:消費者想買什麼);
11
的地得錯誤
【的、地、得相關錯誤】:
更快的找到(正:更快地找到); 全神貫注的聽著(正:全神貫注地聽著);
回家地路上(正:回家的路上); 印章得時候(正:印章的時候);
看的上眼(正:看得上眼); 急的要命(正:急得要命);
忙的天昏地暗(正:忙得天昏地暗); 妙的很(正:妙得很);
12
語法錯誤
【語法錯誤】:
1.進一步障礙了社會的發展。(“障礙”用詞不妥,應改為動詞“阻礙”。)
2.頂不住壓迫而喪失了原則。(“壓迫”是動詞,應改為名詞“壓力”。)
3.他的白血球指數比正常值少三倍。(表示數量的減少,不能用倍數。)
4.曹雪芹的足跡走遍了香山。(“足跡”和“走遍”不搭配。)
13
異形詞
【異形詞】:
定貨(正:訂貨); 簡煉(正:簡練);
秀外惠中(正:秀外慧中); 直接了當(正:直截了當);
14
繁體字詞
【繁體字詞】:
什麽(正:什麼); 金庫(正:金庫);
於是按照(正:於是按照); 文王生於(正:文王生於);
15
“也作”錯誤
【“也作”】(《現代漢語詞典》中沒有條目或註解的“也作xx”的非推薦詞條):
樹陰(正:樹蔭); 想像(正:想像);
其它(正:其他); 撤消(正:撤銷);
背不住(正:備不住); 虎踞龍蟠(正:虎踞龍盤);
16
曾用名錯誤
【曾用名】(曾經使用過的醫學不規範名詞):
氨丁酸(正:氨酪酸); 巴金森(正:帕金森); 紅血球(正:紅細胞);
氯丙硝唑(正:奧硝唑);胸腺多肽(正:胸腺素);
乙醯水楊酸(正:阿司匹林);
17
知識性錯誤
【知識性錯誤】:
廣州黃浦(正:廣州黃埔); 上海黃埔(正:上海黃浦);
廣東河池(正:廣西河池); 廣西雷州(正:廣東雷州);
河北省信陽(正:河南省信陽); 江西省宜興(正:江蘇省宜興);
陝西河津(正:山西河津); 廣西省(正:廣西壯族自治區);
國家林業部(正:國家林業局); 美國劍橋大學(正:英國劍橋大學);
18
人名錯誤
【人名錯誤】:
秋少雲(正:邱少雲);張廣後(正:張廣厚);趙孟頻(正:趙孟頫);
鸝道元(正:酈道元);竺可禎(正:竺可楨);左邱明(正:左丘明);
吳主章(正:吳玉章);錢種書(正:錢鐘書);
19
地名錯誤
【地名錯誤】:
哈蜜(正:哈密);赤蜂市(正:赤峰市);株州(正:株洲);
風翔縣(正:鳳翔縣);嘉裕關(正:嘉峪關);涿洲市(正:涿州市);
梅洲市(正:梅州市);阿賽拜疆(正:亞塞拜然);
塞浦洛斯(正:賽普勒斯);吉爾吉斯坦(正:吉爾吉斯斯坦);
20
英文拼寫錯誤
【英文拼寫】:
Shares worldwide have risen strongly after the latast signs of an econamic recovery in the US.Shares on Wall Street continiued upwards thanks to better-than-expected industrial producation data.The Dow Jones Industrial Averag closed up 107.5 points, or 1.1%, at 9,791, which was an 11-monlth high. It has now risen for eight of the past nine days.
21
標點錯誤
【標點錯誤】:
1.看到<經濟參考報》對3萬多農民深受”高價電”之苦的報導感到震驚。
2.占四川省生產總值的46%左右,。
3.他笑著說::‘很好,就這么辦!”
4.雨還在悄悄地下著……。
5.老張說道:”快點,晚了就來不及了。
22
數字性錯誤
【數字性錯誤】:
他303歲(不符合現實); 在19882年22月36日(錯誤的年月日);
2月31日(2月沒有31日);到了99年(不規範寫法,應為1999年);
淳熙8年(正:淳熙八年); 二0年(正:20年);

相關詞條

熱門詞條

聯絡我們