青海“云藏”打造全球首个藏文智能搜索引擎新载体

时间:2014-12-04 08:40来源:大西北网-中新网 作者: 罗云鹏 点击: 载入中...

       大西北网12月4日讯 “搜索引擎是文化与历史传承的新载体,对一国的文化安全意义重大,‘云藏’是全球首个藏文智能搜索引擎,建成后对藏文信息安全、国内外涉藏舆情监测以及重要舆情分析将提供可靠的参数和依据”。2日,青海省海南藏族自治州藏语委办主任、“云藏”引擎开发负责人才洛告诉记者。

  “云藏”一词是藏文的音译词,有两层含义,其一为“上师”或“老师”,意为有求必应、有问必答;其二是将其分为单字,有“全面抓取、提取”之意。“云藏”搜索引擎是青海省少数民族事业“十二五”规划中藏文信息化建设的重要组成部分,于2013年4月启动系统平台项目建设,研发团队现有100余名工作人员,由藏文信息录入组、分词标注组和技术组3个小组组成,团队中藏族比例达84%,该搜索引擎预计将于2015年年底建设完成,2016年7月正式开通。

  “目前,中国国内如百度、搜狗等主要的搜索引擎中没有藏文搜索功能,但国外搜索引擎反而支持藏文的简单搜索,如谷歌英文版、中文版,雅虎英文版、中文版以及微软的bing搜索引擎等”,才洛说,“由于数据索引库在国外,检索到的信息准确性和内容有受制性,对应出自国内的真实和有效的信息不能被及时检索,提供的有关藏文化知识准确度不高、信息量不够”。

  据了解,“云藏”藏文搜索引擎系统平台建设项目,是一个集搜索引擎、藏文百科、自动问答为一体的大型藏文门户系统工程,将开辟新闻、网页、图片、视频、百科、文库、知道7个板块,“任何搜索引擎中,数据库的建设是最为繁琐艰巨的工作。尤其对于藏文搜索引擎来说是一项从零开始的浩大工程”。才洛介绍,“云藏”搜索引擎覆盖了文化、卫生、教育、科技、宗教、人物等诸多方面,截至目前,已录入历史、文学、宗教、医学、自然以及各类词典等25类资料,共录入12.7万条词条,字数达1197.7万字。

  “‘云藏’建成后,该系统的藏文搜索正确识别率将达95%,不仅能满足藏文网民个性化的检索需求,还将推动藏文信息全方位融入互联网世界。”才洛说,“未来使用藏文的网民输入一个词汇,就会有对应的百科知识,如果词条内容空缺,系统会提示网民自主添加,后台审核通过即可录入数据库,这种方式,将使数据库不断地丰富、扩充”。

  目前已知的藏文网页超过6700万个,初步估算,“云藏”运行初期,青、藏、甘、川、滇五省区的藏文用户数量约为120万,随着搜索引擎产品的推广和宣传,用户量将达200万。 
http://ent.chinanews.com/cul/2014/12-02/6837768.shtml

(责任编辑:鑫报)
>相关新闻
  • 青海防震减灾不松懈构筑生命安全防线
  • 青海狠抓各项政策落实助力企业达产达效
  • 宁夏生态环境厅:做好环评审批“加减法”助推项目落地“加速
  • 宁夏生态环境厅:做好环评审批“加减法”助推项目落地“加速
  • 青海省加速社保“减免返”政策落地
  • 青海设立1.02万个专项岗位助力贫困劳动力就业
  • 顶一下
    (0)
    0%
    踩一下
    (0)
    0%
    ------分隔线----------------------------
    推荐内容
    网站简介  |  保护隐私权  |  免责条款  |  广告服务  |  About Big northwest network  |  联系我们  |  版权声明
    陇ICP备08000781号  Powered by 大西北网络 版权所有  建议使用IE8.0以上版本浏览器浏览
    Copyright © 2010-2014 Dxbei Corporation. All Rights Reserved