ZyBlog
码农老张
  • 首页
  • PHP文章
  • 存储运维
  • 项目产品
  • 路线图
【迅搜16】SCWS分词(一)概念、词性、复合分词等级

正式进入到分词部分的学习了,这也是我们搜索引擎学习的最后一个部分了。在这里,我们还是以 XS 默认的 SCWS 分词器为基础进行学习,但是,就像之前的其它内容一样,原理和概念部分的内容很多都是相通的。即使你将来要用 Jieba 分词或者 IK 分词,它们所有的原理和 SCWS 都是大差不差的。

分类:存储运维 标签:迅搜
【迅搜15】搜索技巧(五)其它功能

又是收尾阶段了,其实在搜索,也就是 XSSearch 这个对象中,剩下的属性方法已经不多了。很多方法和属性在之前的学习中我们都已经使用过或者接触过了,剩下的都是一些锦上添花的功能,但往往这类的功能,却又有着各种不同的惊喜。好吧,到底是惊喜还是惊吓,咱们看完再说吧。

分类:存储运维 标签:迅搜
【迅搜14】搜索技巧(四)搜索日志库及热门、推荐、纠错功能

前面我们已经学习了基本的搜索功能以及非常重要的相关度排序的算法。对于大家日常基本的使用来说,其实有之前的内容就已经非常足够了,但是,一个好的工具,总会有一些意外惊喜的,比如说我们今天要学习的内容。

分类:存储运维 标签:迅搜
【迅搜13】搜索技巧(三)排序与评分算法

今天要学习的,第一部分是排序相关的功能,第二部分则是跟排序密切相关的另一块功能,评分算法。又是算法了,也就是说,又是一大块的理论知识了。今天的文章不长,因为我们的功能测试非常少,但却很重要,因为我们要讲到的理论算法是现在最主流的,也是各种搜索引擎的都在使用的核心算法。如果真的踫到懂行的,确实是用过搜索引擎的面试官,这一块内容绝对是必问内容之一,这么说是不是就很兴奋啦?

分类:存储运维 标签:迅搜
【迅搜12】搜索技巧(二)搜索条件详解

上回我们已经学习了一些简单的搜索功能,比如设置搜索语句、分页方法、数量查询以及高亮和折叠的查询效果。而今天,我们将更加深入地学习其它搜索相关的内容。最核心的,就是布尔查询,也就是类似于我们在数据库中的 AND 和 OR 之类的语法。不过在这之前,就像是 Explain 可以分析数据库的查询语句一样。XS 也为我们提供了一个可以查看分词结果以及查询条件的方法,我们得先来学会它的使用。

分类:存储运维 标签:迅搜
【迅搜11】搜索技巧(一)简单搜索语句构建及高亮折叠效果

学习完索引管理相关的内容之后,我们就进入到了搜索技巧相关的学习了。其实对应在 XS 中,就是 SDK 中的 XSSearch 对象的相关学习和使用。同样的,在这一部分,我们也会普及很多搜索相关的知识。

分类:存储运维 标签:迅搜
【迅搜10】索引管理(三)同义词及其它属性方法

学习完索引操作最核心的增、删、改操作之后,我们再来学习它的其它一些功能。其中,比较有意思的是一个同义词操作的功能,我们先来看看这个功能的操作。

分类:存储运维 标签:迅搜
【迅搜09】索引管理(二)增删改操作

今天我们来学习真正的,最核心的索引管理相关的操作。但其实今天的内容还更简单一些,为啥呢?因为索引管理中,最核心的就是对于数据的增、删、改呀。其实要往大了说,查询也是针对索引的操作,只不过相对来说,搜索引擎引用往往是读多写少,而且相比数据库来说,它的写还要少一些。

分类:存储运维 标签:迅搜
【迅搜08】XS 索引管理(一)切换索引库与文档对象

不管任何搜索引擎,最核心的部分,往往都只有两个,一是建立索引,二是搜索数据。不过对于中文这种复杂的语言体系,分词也是另一块核心内容。从今天开始,我们就先来学习第一块的内容,就是对于索引的操作。

分类:存储运维 标签:迅搜
【迅搜07】基础对象概览(二)服务器与命令对象及数据传输原理

在学习完最基础的 XS 对象和一些字段对象之后,我们今天将学习到的是 XS 的 PHP SDK 中非常核心的一个对象,那就是 XSServer 对象。从名字就可以看出,它是负责和服务端交互的,也就是 PHP 与 Xapian 的交互部分。要说搜索索引,最核心的应该是在索引和搜索的操作上,这两部分也是我们后面要重点关注的部分。但是,如果没有 XSServer 的支持,则一切都无法实现。幸好,这一部分的内容不多,也并不复杂,咱们就好好来看一下。

分类:存储运维 标签:迅搜
【迅搜06】基础对象概览(一)索引项目与字段对象

好了,咱们的学习要更进一步了,现在进入到的就是整个 XS 学习的核心部分,PHP SDK 相关操作的学习。其实说白了,对于 PHP 代码中使用 XS 的功能,无非就是我们之前已经演示的那些内容。最核心的就是三个对象:XS、XSIndex 和 XSSearch 对象。但是整个 XS 中又不完全是这三个对象的内容,还有一些其它的对象也有着非常重要的作用。因此,在这一篇和下一篇文章中,我们将以 XS 对象为切入点,同时学习一下一些其它方面的基础对象。

分类:存储运维 标签:迅搜
【迅搜05】索引配置(二)字段定义与设计

经过上篇文章的学习,我们已经了解到了 XS 中的默认索引配置是在哪里,也了解到了配置文件如何加载以及服务端的一些简单配置。今天,我们要学习的重点就是剩下的内容,也是非常重要的内容,那就是索引字段的配置定义以及字段设计。

分类:存储运维 标签:迅搜
【迅搜04】索引配置(一)加载配置文件以及服务端配置

对于一个搜索引擎来说,索引配置是非常重要,并且也是非常核心的内容。在 XS 中,我们的索引配置是通过一个配置文件来实现的。在前两篇文章的测试中,我们使用了一个叫做 demo 的索引配置。当时,我们直接就是写了一个 demo 这个名称,那么这个配置文件具体在哪里呢?

分类:存储运维 标签:迅搜
【迅搜03】全文检索、文档、倒排索引与分词

今天还是概念性的内容,但是这些概念却是整个搜索引擎中最重要的概念。可以说,所有的搜索引擎就是实现了类似的概念才能称之为搜索引擎。而且今天的内容其实都是相关联的,所以不要以为标题上有四个名词就感觉好像内容很多一样,其实它们都是联系紧密的,一环套一环的。

分类:存储运维 标签:迅搜
【迅搜02】究竟什么是搜索引擎?正式介绍XunSearch

啥?还要单独讲一下啥是搜索引擎?不就是百度、Google嘛,这玩意天天用,还轮的到你来说?额,好吧,虽然大家天天都在用,但是我发现,其实很多人对搜索引擎并不是特别了解,更别提搜索引擎开发了。不信?那么咱们就一步一步来看。

分类:存储运维 标签:迅搜
【迅搜01】安装运行并测试XunSearch

这回的新系列,我们将学习到的是一个搜索引擎 迅搜 XunSearch 的使用。这个搜索引擎在 PHP 圈可能还是有一点名气的,而且也是一直在更新的,虽说现在 ElasticSearch 已经是实际上的搜索引擎霸主了,而且还有 Solr 在后的不断追赶,但要说最简单、最实在,而且最容易让我们这些 PHPer 上手的,绝对还是 XunSearch 。

分类:存储运维 标签:迅搜
【Nginx41】Nginx学习:Stream四层负载均衡浅尝及总

学习了这么久,也该有个结束了,在最后一篇中,我们先来看一下 Nginx 做四层代理并实现负载均衡的模块。这个和 HTTP 模块中的七层代理没啥差别,就简单演示一下。最后,再稍稍总结一下,主要就是讲讲我们还有哪些东西没讲到。毕竟整个 Nginx 体系就是一个应用服务器体系的学习,牵涉到的东西还有很多。那么出于什么原因咱们不再继续了呢?别急,下面会说出原因。

分类:存储运维 标签:Nginx
【Nginx40】Nginx学习:动静分离与日志分割

放轻松放轻松,最后两篇文章学习的内容是比较轻松的。首先,我们来看看 Nginx 动静分离的概念,然后再看看怎么为 Nginx 做日志分割。内容都很简单,完全不需要有任何的压力。

分类:存储运维 标签:Nginx
【Nginx39】Nginx学习:upstream服务器组模块

最后一个重点模块内容啦,感谢坚持到现在的你和我。总算是向大佬的道路上又前进了一步了。今天的内容主要是服务器组的配置,其实更直白点,就是 Nginx 负载均衡的配置模块。会不会有小伙伴不明白负载均衡是啥?如果是新同学,还不明白的话,要自己查查资料补习一下了哦。

分类:存储运维 标签:Nginx
【Nginx38】Nginx学习:SSL模块(二)错误状态码、变量及宝塔配置分析

继续我们的 SSL 模块的学习。上回其实我们已经搭建起了一个 HTTPS 服务器了,只用了三个配置,其中一个是 listen 的参数,另外两个是指定密钥文件的地址,一个是 crt 文件,一个是 key 文件。今天我们将学习到的是 SSL 中的错误状态码、变量相关的内容,以及最后会看一下在宝塔中配置 SSL 之后,它生成的配置指令是什么样的。

分类:存储运维 标签:Nginx
  • <<
  • ...
  • 3
  • 4
  • 5
  • ...
  • >>