搜索

简介
全文搜索
- 添加全文索引
- 执行全文查询
语义/向量搜索
重排序结果
Laravel Scout
- 数据库引擎
- 第三方引擎
结合技术

简介

几乎每个应用程序都需要搜索功能。无论你的用户是在知识库中搜索相关文章、浏览产品目录，还是针对文档集提出自然语言问题，Laravel 都提供了内置工具来处理这些场景——而且通常你不需要任何外部服务即可实现。

大多数应用程序会发现，Laravel 提供的内置数据库驱动选项已经足够——只有当你需要大规模容错、分面过滤或地理搜索等功能时，才需要外部搜索服务。

全文搜索

当你需要关键词相关性排序——即数据库根据搜索结果与搜索词的匹配程度进行评分和排序时——Laravel 的 whereFullText 查询构建器方法利用了 MariaDB、MySQL 和 PostgreSQL 的原生全文索引。全文搜索能够理解单词边界和词干提取，因此搜索 "running" 可以匹配包含 "run" 的记录。无需外部服务。

语义/向量搜索

对于由 AI 驱动的语义搜索，通过含义而非精确关键词来匹配结果，whereVectorSimilarTo 查询构建器方法使用存储在 PostgreSQL（带有 pgvector 扩展）中的向量嵌入。例如，搜索 "best wineries in Napa Valley" 可以找到一篇标题为 "Top Vineyards to Visit" 的文章——即使单词并不重叠。向量搜索需要安装了 pgvector 扩展的 PostgreSQL 和 Laravel AI SDK。

重排序

Laravel 的 AI SDK 提供了重排序功能，可以使用 AI 模型根据与查询的语义相关性对任何结果集进行重新排序。重排序尤其强大，可以作为快速初始检索步骤（如全文搜索）之后的第二阶段——既保证了速度，又实现了语义准确性。

Laravel Scout 搜索

对于那些希望使用 Searchable trait 自动使搜索索引与 Eloquent 模型保持同步的应用程序，Laravel Scout 既提供了一个内置的数据库引擎，也提供了用于第三方服务（如 Algolia、Meilisearch 和 Typesense）的驱动程序。

全文搜索

虽然 LIKE 查询对于简单的子字符串匹配效果很好，但它们不理解语言。搜索 "running" 的 LIKE 查询无法找到包含 "run" 的记录，并且结果不会按相关性排序——它们只是按照数据库找到它们的任何顺序返回。全文搜索通过使用专门的索引来解决这两个问题，这些索引能够理解单词边界、词干提取和相关性评分，使数据库能够首先返回最相关的结果。

MariaDB、MySQL 和 PostgreSQL 都内置了快速的全文搜索——无需外部搜索服务。你只需在要搜索的列上添加全文索引，然后使用 whereFullText 查询构建器方法进行搜索。

警告

全文搜索目前受 MariaDB、MySQL 和 PostgreSQL 支持。

添加全文索引

要使用全文搜索，首先在要搜索的列上添加一个全文索引。你可以将索引添加到单个列，或传递一个列数组来创建跨多个字段同时搜索的组合索引：

php

Schema::create('articles', function (Blueprint $table) {
    $table->id();
    $table->string('title');
    $table->text('body');
    $table->timestamps();

    $table->fullText(['title', 'body']);
});

在 PostgreSQL 上，你可以为索引指定语言配置，用于控制单词的词干提取方式：

php

$table->fullText('body')->language('english');

有关创建索引的更多信息，请查阅迁移文档。

执行全文查询

索引就位后，使用 whereFullText 查询构建器方法进行搜索。Laravel 将为你的数据库驱动生成相应的 SQL——例如，在 MariaDB 和 MySQL 上生成 MATCH(...) AGAINST(...)，在 PostgreSQL 上生成 to_tsvector(...) @@ plainto_tsquery(...)：

php

$articles = Article::whereFullText('body', 'web developer')->get();

当使用 MariaDB 和 MySQL 时，结果会自动按相关性得分排序。在 PostgreSQL 上，whereFullText 会过滤匹配的记录，但不会按相关性排序——如果你需要在 PostgreSQL 上自动按相关性排序，可以考虑使用 Scout 的数据库引擎，它会为你处理这个问题。

如果你创建了一个跨多个列的组合全文索引，可以通过将相同的列数组传递给 whereFullText 来搜索所有这些列：

php

$articles = Article::whereFullText(
    ['title', 'body'], 'web developer'
)->get();

orWhereFullText 方法可用于将全文搜索子句作为 "or" 条件添加。有关完整详情，请查阅查询构建器文档。

语义/向量搜索

全文搜索依赖于匹配关键词——查询中的单词必须以某种形式出现在数据中。语义搜索采用了一种根本不同的方法：它使用 AI 生成的向量嵌入来表示文本的含义，将其表示为数字数组，然后找到其含义与查询最相似的结果。例如，搜索 "best wineries in Napa Valley" 可以找到一篇标题为 "Top Vineyards to Visit" 的文章——即使单词根本不重叠。

向量搜索的基本工作流程是：为每段内容生成一个嵌入（一个数字数组）并将其与数据一起存储，然后在搜索时，为用户查询生成一个嵌入，并找到在向量空间中与之最接近的已存储嵌入。

NOTE

向量搜索需要 Laravel AI SDK，并由 PostgreSQL（需要 pgvector 扩展）和 MongoDB（需要 Laravel MongoDB 包）提供支持。Laravel Cloud 上的所有 Postgres 数据库均已安装 pgvector。

生成嵌入

嵌入是一个高维数字数组（通常包含数百或数千个数字），它代表一段文本的语义含义。你可以使用 Laravel 的 Stringable 类上可用的 toEmbeddings 方法为字符串生成嵌入：

php

use Illuminate\Support\Str;

$embedding = Str::of('Napa Valley has great wine.')->toEmbeddings();

要一次为多个输入生成嵌入——这比逐一生成更高效，因为它只需要对嵌入提供商进行一次 API 调用——请使用 Embeddings 类：

php

use Laravel\Ai\Embeddings;

$response = Embeddings::for([
    'Napa Valley has great wine.',
    'Laravel is a PHP framework.',
])->generate();

$response->embeddings; // [[0.123, 0.456, ...], [0.789, 0.012, ...]]

有关配置嵌入提供商、自定义维度和缓存的更多详细信息，请查阅 AI SDK 文档。

存储和索引向量

要存储向量嵌入，请在迁移中定义一个 vector 列，指定与嵌入提供商输出匹配的维度数（例如，OpenAI 的 text-embedding-3-small 模型为 1536）。你还应该在该列上调用 index 来创建一个 HNSW（分层可导航小世界）索引，这可以显著加快大型数据集上的相似性搜索速度：

php

Schema::ensureVectorExtensionExists();

Schema::create('documents', function (Blueprint $table) {
    $table->id();
    $table->string('title');
    $table->text('content');
    $table->vector('embedding', dimensions: 1536)->index();
    $table->timestamps();
});

Schema::ensureVectorExtensionExists 方法确保在创建表之前，你的 PostgreSQL 数据库上启用了 pgvector 扩展。

在你的 Eloquent 模型上，将向量列转换为 array 类型，以便 Laravel 自动处理 PHP 数组和数据库向量格式之间的转换：

php

protected function casts(): array
{
    return [
        'embedding' => 'array',
    ];
}

有关向量列和索引的更多详细信息，请查阅迁移文档。

相似性查询

一旦你为内容存储了嵌入，就可以使用 whereVectorSimilarTo 方法搜索相似的记录。此方法使用余弦相似度将给定的嵌入与存储的向量进行比较，过滤掉低于 minSimilarity 阈值的结果，并自动按相关性对结果排序——最相似的记录排在前面。阈值应为介于 0.0 和 1.0 之间的值，其中 1.0 表示向量完全相同：

php

$documents = Document::query()
    ->whereVectorSimilarTo('embedding', $queryEmbedding, minSimilarity: 0.4)
    ->limit(10)
    ->get();

为了方便起见，当给定一个普通字符串而不是嵌入数组时，Laravel 将使用你配置的嵌入提供商自动为你生成嵌入。这意味着你可以直接传递用户的搜索查询，而无需先手动将其转换为嵌入：

php

$documents = Document::query()
    ->whereVectorSimilarTo('embedding', 'best wineries in Napa Valley')
    ->limit(10)
    ->get();

对于对向量查询的更低级控制，还可以使用 whereVectorDistanceLessThan、selectVectorDistance 和 orderByVectorDistance 方法。这些方法让你直接处理距离值而不是相似度分数，将计算出的距离作为列选择到结果中，或手动控制排序。有关完整详情，请查阅查询构建器文档和 AI SDK 文档。

重排序结果

重排序是一种技术，其中 AI 模型根据每个结果与给定查询的语义相关性重新排列一组结果。与需要预先计算和存储嵌入的向量搜索不同，重排序适用于任何文本集合——它将原始内容和查询作为输入，并返回按相关性排序的项目。

重排序尤其强大，可以作为快速初始检索步骤之后的第二阶段。例如，你可以使用全文搜索快速将数千条记录缩小到前 50 个候选，然后使用重排序将最相关的结果放在顶部。这种“检索然后重排序”的模式既提供了速度，又实现了语义准确性。

你可以使用 Reranking 类对字符串数组进行重排序：

php

use Laravel\Ai\Reranking;

$response = Reranking::of([
    'Django is a Python web framework.',
    'Laravel is a PHP web application framework.',
    'React is a JavaScript library for building user interfaces.',
])->rerank('PHP frameworks');

$response->first()->document; // "Laravel is a PHP web application framework."

Laravel 集合也有一个 rerank 宏，它接受一个字段名（或闭包）和一个查询，使得对 Eloquent 结果进行重排序变得容易：

php

$articles = Article::all()
    ->rerank('body', 'Laravel tutorials');

有关配置重排序提供商和可用选项的完整详细信息，请查阅 AI SDK 文档。

Laravel Scout

上面描述的搜索技术都是你可以直接在代码中调用的查询构建器方法。Laravel Scout 采用了一种不同的方法：它提供了一个 Searchable trait，你可以将其添加到你的 Eloquent 模型中，Scout 会在记录创建、更新和删除时自动保持你的搜索索引同步。当你希望模型始终可搜索而无需手动管理索引更新时，这特别方便。

数据库引擎

Scout 的内置数据库引擎针对你现有的数据库执行全文和 LIKE 搜索——无需外部服务或额外基础设施。只需将 Searchable trait 添加到你的模型，并定义一个 toSearchableArray 方法，返回你希望可搜索的列。

你可以使用 PHP 属性来控制每个列的搜索策略。SearchUsingFullText 将使用数据库的全文索引，SearchUsingPrefix 将仅从字符串开头匹配 (example%)，而没有属性的任何列将使用默认的 LIKE 策略，两侧带有通配符 (%example%)：

php

<?php

namespace App\Models;

use Illuminate\Database\Eloquent\Model;
use Laravel\Scout\Attributes\SearchUsingFullText;
use Laravel\Scout\Attributes\SearchUsingPrefix;
use Laravel\Scout\Searchable;

class Article extends Model
{
    use Searchable;

    #[SearchUsingPrefix(['id'])]
    #[SearchUsingFullText(['title', 'body'])]
    public function toSearchableArray(): array
    {
        return [
            'id' => $this->id,
            'title' => $this->title,
            'body' => $this->body,
        ];
    }
}

警告

在指定列应使用全文查询约束之前，请确保该列已分配了全文索引。

一旦添加了 trait，你就可以使用 Scout 的 search 方法搜索模型。Scout 的数据库引擎将自动按相关性对结果排序，即使在 PostgreSQL 上也是如此：

php

$articles = Article::search('Laravel')->get();

当你的搜索需求适中，并且希望在不部署外部服务的情况下享受 Scout 自动索引同步的便利时，数据库引擎是一个很好的选择。它能很好地处理最常见的搜索用例，包括过滤、分页和软删除记录处理。有关完整详情，请查阅 Scout 文档。

第三方引擎

Scout 还支持第三方搜索引擎，如 Algolia、Meilisearch 和 Typesense。这些专用的搜索服务提供了高级功能，如容错、分面过滤、地理搜索和自定义排序规则——这些功能在规模非常大或当你需要高度精致的即输即搜体验时会变得很重要。

由于 Scout 在其所有驱动程序上提供了统一的 API，稍后从数据库引擎切换到第三方引擎只需要最少的代码更改。你可以从数据库引擎开始，只有当应用程序的需求超出数据库所能提供的范围时，才迁移到第三方服务。

有关配置第三方引擎的完整详细信息，请查阅 Scout 文档。

NOTE

许多应用程序永远不需要外部搜索引擎。此页面上描述的内置技术涵盖了绝大多数用例。

结合技术

此页面上描述的搜索技术并非相互排斥——将它们结合起来通常能产生最佳结果。以下是两种常见模式，演示了这些工具如何协同工作。

全文检索 + 重排序

使用全文搜索快速将大型数据集缩小到候选集，然后应用重排序根据语义相关性对这些候选进行排序。这结合了数据库原生全文搜索的速度和 AI 驱动的相关性评分的准确性：

php

$articles = Article::query()
    ->whereFullText('body', $request->input('query'))
    ->limit(50)
    ->get()
    ->rerank('body', $request->input('query'), limit: 10);

向量搜索 + 传统过滤

将向量相似性与标准 where 子句结合，将语义搜索限定于记录子集。当您需要基于含义的搜索，但需要按所有权、类别或任何其他属性限制结果时，这非常有用：

php

$documents = Document::query()
    ->where('team_id', $user->team_id)
    ->whereVectorSimilarTo('embedding', $request->input('query'))
    ->limit(10)
    ->get();

搜索 ​

简介 ​

全文搜索 ​

语义/向量搜索 ​

重排序 ​

Laravel Scout 搜索 ​

全文搜索 ​

添加全文索引 ​

执行全文查询 ​

语义/向量搜索 ​

生成嵌入 ​

存储和索引向量 ​

相似性查询 ​

重排序结果 ​

Laravel Scout ​

数据库引擎 ​

第三方引擎 ​

结合技术 ​

搜索

简介

全文搜索

语义/向量搜索

重排序

Laravel Scout 搜索

全文搜索

添加全文索引

执行全文查询

语义/向量搜索

生成嵌入

存储和索引向量

相似性查询

重排序结果

Laravel Scout

数据库引擎

第三方引擎

结合技术