大西北網(wǎng)12月4日訊 “搜索引擎是文化與歷史傳承的新載體,對(duì)一國的文化安全意義重大,‘云藏’是全球首個(gè)藏文智能搜索引擎,建成后對(duì)藏文信息安全、國內(nèi)外涉藏輿情監(jiān)測(cè)以及重要輿情分析將提供可靠的參數(shù)和依據(jù)”。2日,青海省海南藏族自治州藏語委辦主任、“云藏”引擎開發(fā)負(fù)責(zé)人才洛告訴記者。
“云藏”一詞是藏文的音譯詞,有兩層含義,其一為“上師”或“老師”,意為有求必應(yīng)、有問必答;其二是將其分為單字,有“全面抓取、提取”之意。“云藏”搜索引擎是青海省少數(shù)民族事業(yè)“十二五”規(guī)劃中藏文信息化建設(shè)的重要組成部分,于2013年4月啟動(dòng)系統(tǒng)平臺(tái)項(xiàng)目建設(shè),研發(fā)團(tuán)隊(duì)現(xiàn)有100余名工作人員,由藏文信息錄入組、分詞標(biāo)注組和技術(shù)組3個(gè)小組組成,團(tuán)隊(duì)中藏族比例達(dá)84%,該搜索引擎預(yù)計(jì)將于2015年年底建設(shè)完成,2016年7月正式開通。
“目前,中國國內(nèi)如百度、搜狗等主要的搜索引擎中沒有藏文搜索功能,但國外搜索引擎反而支持藏文的簡單搜索,如谷歌英文版、中文版,雅虎英文版、中文版以及微軟的bing搜索引擎等”,才洛說,“由于數(shù)據(jù)索引庫在國外,檢索到的信息準(zhǔn)確性和內(nèi)容有受制性,對(duì)應(yīng)出自國內(nèi)的真實(shí)和有效的信息不能被及時(shí)檢索,提供的有關(guān)藏文化知識(shí)準(zhǔn)確度不高、信息量不夠”。
據(jù)了解,“云藏”藏文搜索引擎系統(tǒng)平臺(tái)建設(shè)項(xiàng)目,是一個(gè)集搜索引擎、藏文百科、自動(dòng)問答為一體的大型藏文門戶系統(tǒng)工程,將開辟新聞、網(wǎng)頁、圖片、視頻、百科、文庫、知道7個(gè)板塊,“任何搜索引擎中,數(shù)據(jù)庫的建設(shè)是最為繁瑣艱巨的工作。尤其對(duì)于藏文搜索引擎來說是一項(xiàng)從零開始的浩大工程”。才洛介紹,“云藏”搜索引擎覆蓋了文化、衛(wèi)生、教育、科技、宗教、人物等諸多方面,截至目前,已錄入歷史、文學(xué)、宗教、醫(yī)學(xué)、自然以及各類詞典等25類資料,共錄入12.7萬條詞條,字?jǐn)?shù)達(dá)1197.7萬字。
“‘云藏’建成后,該系統(tǒng)的藏文搜索正確識(shí)別率將達(dá)95%,不僅能滿足藏文網(wǎng)民個(gè)性化的檢索需求,還將推動(dòng)藏文信息全方位融入互聯(lián)網(wǎng)世界。”才洛說,“未來使用藏文的網(wǎng)民輸入一個(gè)詞匯,就會(huì)有對(duì)應(yīng)的百科知識(shí),如果詞條內(nèi)容空缺,系統(tǒng)會(huì)提示網(wǎng)民自主添加,后臺(tái)審核通過即可錄入數(shù)據(jù)庫,這種方式,將使數(shù)據(jù)庫不斷地豐富、擴(kuò)充”。
目前已知的藏文網(wǎng)頁超過6700萬個(gè),初步估算,“云藏”運(yùn)行初期,青、藏、甘、川、滇五省區(qū)的藏文用戶數(shù)量約為120萬,隨著搜索引擎產(chǎn)品的推廣和宣傳,用戶量將達(dá)200萬。
http://ent.chinanews.com/cul/2014/12-02/6837768.shtml