本文共 396 字,大约阅读时间需要 1 分钟。
什么是全文检索?
数据的分类:
1,结构化数据
格式固定,长度固定,数据类型固定
eg:数据库中的数据
2,非结构化数据
word文档,pdf文档,邮件,html,txt
格式不固定,长度不固定,数据类型不固定。
数据的查询:
1,结构化数据的查询
SQL语句,查询结构化数据的方法。简单,速度快。
2,非结构化数据的查询
从文本文件中找出包含spring单词的文件
a,自测
b,使用程序把文档读取到内存中,然后匹配字符串,顺序扫描。
c,把非结构化数据转化为结构化文档
---先根据空格进行字符串的拆分,得到一个单词列表,基于单词列表创建一个索引。
然后查询索引,根据单词和文档的对应关系找到文档列表,这个过程叫全文检索。
--索引:一个为了提高查询速度,创建某种数据结构的集合。
3,全文检索:
先创建索引,然后查询索引的过程叫做全文检索。
索引一次创建多次使用,表现为每次查询速度快。
转载地址:http://qrmn.baihongyu.com/