Coco AI × Amazon S3:秒搜你的云端文件

随着企业和个人数据量的激增,如何高效管理与搜索云端资料,成为提升工作效率的关键。
Coco-AI 新增的 S3 对象存储连接器,可以将 Amazon S3 存储桶直接接入智能检索系统,实现秒级搜索、即时访问,让云端文件像本地文档一样触手可及。

本篇将详细介绍如何通过 Docker 快速部署 Coco Server,并配置 S3 连接器,完成与亚马逊云科技的无缝集成。

一、快速部署 Coco Server

Coco Server 是连接器功能的运行核心,部署好它后才能接入 S3。
生产环境建议使用持久化存储方式,避免数据丢失。

推荐部署方式(生产环境)
持久化存储,避免数据丢失:

1
2
3
4
5
6
7
docker run -d \
--name cocoserver \
-p 9000:9000 \
-v data:/app/easysearch/data \
-v config:/app/easysearch/config \
-v logs:/app/easysearch/logs \
infinilabs/coco:0.7.1-2426
阅读更多

用Filebeat OSS 7.10.2将收集日志到Easysearch

Filebeat OSS (Open Source Software) 7.10.2 版本是 Elastic 公司提供的开源版本。移除了一些Elasticsearch商业化的功能插件(但是没移出去干净)

https://www.elastic.co/cn/downloads/past-releases/filebeat-oss-7-10-2。

这主要还是 AWS 和 Elastic 公司之间的矛盾,AWS 托管的 ES 会和 Elastic 抢客户。所以 Elastic 搞了一个不能商业化的协议,影响了这个生态圈,也给开发者造成了很多不方便。

阅读更多

Easysearch 实战指南:修改索引主分片的三种方式(split shrink reindex

在 Easysearch(兼容 Elasticsearch)的架构中,索引的主分片数(index.number_of_shards)一旦创建就无法直接修改。这给实际使用带来挑战:

  • 设得太少,查询/写入瓶颈出现;
  • 设得太多,资源浪费、集群不稳;
  • 想变更结构,却发现配置是“写死”的。

本文将带你深入了解三种常见但本质不同的索引重构方式:splitshrinkreindex,教你如何选择合适方案、安全操作,并解释为什么split + shrink 无法取代 reindex


📌 一张图概览三种方式

方法 是否重建索引 可否原名使用 改分片数限制 是否保留数据 是否改结构(mapping/settings) 常见用途
split ✅ 新建索引 ❌ 不支持 只能 × 倍数(如 1→2→4) ✅ 是 ❌ 否 提升写入并发/读性能
shrink ✅ 新建索引 ❌ 不支持 只能 ÷ 因数(如 4→2→1) ✅ 是 ❌ 否 合并历史数据分片
reindex ✅ 新建索引 ✅ 支持(先删) 任意 ✅ 是 ✅ 支持 自定义结构/分片/升级

🔧 一、split:将分片数量倍增(如 1 → 2 → 4)

适用于: 提升并发能力、增加查询/写入并行度。

阅读更多

Easysearch 索引关闭与重开全攻略:open close 操作、批量处理及防误操作配置

在 Easysearch(兼容 Elasticsearch 的搜索引擎)中,索引是存储和查询的基本单元。默认情况下,索引是处于 open 状态的,可以正常写入和搜索。当你暂时不使用某些索引,但又不想删除它们时,可以通过 close 操作来关闭索引,从而释放部分内存资源。


📊 查看索引状态

使用以下命令可以查看当前集群中所有索引的状态:

1
GET _cat/indices?v

创建一个索引并插入数据:

1
2
3
4
POST abc/_doc
{
"a": 1
}
阅读更多

本地 RAG 实战:用 Easysearch + Ollama SDK 半小时搭建检索增强问答系统

✅ 目标:只用两台服务器(或同一台)就跑通 “向量检索 + 本地大模型” 原型
✅ 特点:完全离线、依赖极少、部署脚本即文档
✅ 适合:快速 PoC、内网合规场景、想深挖 RAG 工作机理的开发者

生成式 AI 聊天固然强大,但当问题依赖本地私有知识时,单靠 LLM 参数内的“世界记忆”往往答非所问。RAG(Retrieval-Augmented Generation) 的思路是:

  1. 把文档切片 → 向量化 → 入库
  2. 用户提问 → 同样向量化 → 检索
  3. 将召回片段拼进 prompt,让大模型“带着材料”再回答

多数教程直接用云端 Embedding+OpenAI GPT-4o,但一些团队因隐私、成本或离线环境无法这样做。
本文选用:

  • EasySearch (= OpenSearch + Elastiknn) 做向量存取
  • Ollama SDK 连接本地 LLM
  • Python + requests + ollama 三个依赖即可
阅读更多

轻松管理 ES 集群:我把 Infinilabs Console 上架了懒猫微服,默认支持外网访问、

之前我的 infinilabs Console 一直跑在群晖里,由于和 Coco-AI 的默认端口冲突,导致经常忘记端口信息,群晖里运行着 Easysearch,Elasticsearch、OpenSearch 三个大集群,也想慢慢迁移到其他性能高的机器上去,正好最近购买了懒猫微服,能够让我做应用的迁移,顺便还得能上架一些应用。

Infinilabs.console 是什么?

如果你用过 Elasticsearch,那就一定知道 Kibana。Infinilabs Console,就是极限科技团队开发的国产可视化控制台,是一个面向 Easysearch、Elasticsearch 和 OpenSearch 的运维、监控、数据管理平台,可以看作是国产版的 Kibana 替代品。

最初接触这个款产品的时候让我眼前一亮,它能够借助 Easysearch 或者 Elasticsearch 的 REST API 来连接集群,同时也高效地管理和监控 Elasticsearch、OpenSearch 以及 INFINI Easysearch 等搜索引擎集群,提供统一的运维、监控、安全和数据管理能力。这一点其实是 Kibana 比不了的,尽管是老牌软件,但是初学 ES 的时候 Kibana 连接 ES 要查 log 设置一些 key,这个整个部署过程就花了一个小上午的时间。而且跨版本,跨引擎来支持的能力也是其他可视化工具无法比拟的。简单来说,真的很符合国人的使用习惯。

阅读更多

MySQL数据实时接入Easysearch,零代码迁移全流程

随着业务对数据搜索与分析能力的要求不断提高,越来越多的团队开始将关系型数据库中的数据迁移至搜索引擎中。
本篇文章将分享如何通过AWS DMS,实现 MySQL 数据无缝迁移到EasySearch,并打通实时同步链路的全过程。

注意:AWS DMS 原生仅支持托管的 OpenSearch 和 Elasticsearch,不直接支持 EasySearch。本文将介绍如何通过一些配置技巧,优雅地解决这个问题。


一、准备 MySQL 源数据库

1. 创建数据库与数据表

首先,我们需要准备好待迁移的 MySQL 数据库。我这里使用的是DBeaver工具,当然你也可以选择更专业的 MySQL Workbench 或 DataGrip。

新建数据库时,选择utf8mb4编码,库名命名为source(后续 DMS 迁移任务中会用到)。

新建数据库

接下来创建数据表并定义字段。图形化工具可以避免手写 DDL,对非 DBA 用户非常友好。

阅读更多

从认证到透传:用 Nginx 为 Easysearch 构建一体化认证网关

在构建本地或云端搜索引擎系统时,EasySearch 凭借其轻量、高性能、易部署等优势,逐渐成为众多开发者和技术爱好者的首选。但在实际部署过程中,如何借助 Nginx 为 EasySearch 提供高效、稳定且安全的访问入口,尤其是在身份认证方面,仍然是一个关键技术环节。

本教程将围绕 Basic Auth 认证机制展开,系统讲解如何通过 Nginx 实现安全防护、认证信息透传等常见配置场景,帮助你在多种实际部署环境中快速搭建可靠的访问控制机制。

阅读更多

Easysearch 服务昨天还好好的,为什么今天突然访问不了了?

在使用 Easyearch 搭建本地或云端搜索服务时,难免会遇到服务偶发性或持续性无法访问的问题。本文将从服务状态、端口监听、网络配置、安全组等五个维度,系统梳理排查思路,帮助大家快速定位并解决访问失败的原因。


🚢 一、Docker 部署场景下的排查方法

如果你是通过官方的 Docker Compose 部署 EasySearch,一般不会出现太大问题。但如果你像我一样在群晖或 NAS 上做过自定义配置,以下通用排查方法可以帮助你快速定位问题:

阅读更多
Your browser is out-of-date!

Update your browser to view this website correctly.&npsb;Update my browser now

×