全文检索系统
信息化助理的全文检索系统是一个功能多、性能高、架构灵活的全文索引和检索平台,它可以帮助企业在海量的结构化、非结构化电子文件中,快速而精准地找到特定的信息,以提高企业文档的利用效率。
它广泛应用于协调办公平台、数字图书馆、档案馆、知识库、专业数据库、行业数据库检索等领域。
|
|
1. 功能特点
快速响应:对千万级别的数据检索,检索结果页面的响应平均时间小于1秒;
增量索引:高效的增量索引技术可使得信息即时采集即时检索;
结构化索引:结构化索引技术支持检索容量的无限扩展;
权限过滤:在检索结果显示时进行权限过滤,即检索者只可以见到自己有权阅读的文件;
丰富的检索结果展示:可根据用户的需要提供多种检索结果展示方式如按不同的规则进行排序;
支持多字段组合查询、模糊匹配查询、支持大于,等于,小于等,通过查询分析接口,可以根据 用户需要定制特殊的查询语法规则;
支持ORACLE、MS SQL SERVER、MySQL等主流数据库;
支持非结构化文件和关系数据库的全文检索,可满足各种类型用户对全文检索的需求;
支持多种语言编码,内核支持GB2312 / GBK / GB18030编码,BIG5编码,UTF8编码;
良好的中文分词能力,支持对中文的按字切分和二元切分检索;
可检索各种数字,字母,及英文。可检索文件名中的关键字,可检索文件的附属信息,例如:作者, 版本,修改历史,注释等;
可检索的文件类型基本覆盖了常见的所有文件类型如Word、Excel、PowerPoint、HTML、PDF、TXT、 xml、java、jsp、js、csv、tif等文件格式;
高效的数据和索引压缩技术,服务器磁盘空间膨胀率低;
多线程设计,并发访问性能高,系统资源占用率低,对服务器硬件资源要求低;
支持分布式系统设计,系统的负载能力可平滑扩展;
可嵌入客户已有的业务系统,满足个性化需求。
|
|
2. 比较优势
性能:信息化助理系统是一个电信级运营系统,全文检索系统是该系统的一个模块子系统,其性能可满足大用户量的重负荷运行需求;
扩展:采用信息化助理之企业短信系统,只须购买相应的模块就在一个服务器上进行如下功能扩展---企业邮局、智能建站、企业文件管理、个人信息助理、桌面备份、网络硬盘、网络传真等,可为企业节省成本,提高效率。
服务:电信级别的系统维护服务,专业水平的问题答疑,可减少公司在系统维护方面的人力成本。
|
|
3. 运行环境 |
序号 |
软硬件件名称 |
规格及版本
|
1 |
服务器硬件 |
普通PC服务器 |
2 |
操作系统与数据库 |
Red Hat Linux 企业版5 + MYSQL/SQLITE/ORACLE数据库 |
3 |
应用服务器 |
Apache 2.2.8 |
|
|