AI知识库应用篇

需求分析

知识库这几乎是AI的入门级需求。人性化对话,精准回复问题。同时,大语言模型来做背后支撑。

  • 企业级的客服、助手类商业需求。

这里的步骤有时是预先操作的,比如上传,向量化之类。

下面是更清晰的知识库的构建:

  • 个人使用的,对有限集知识库的需要,即对话式的知识查询

如果是为了个人的知识梳理和研究需要,那么此类推荐豆包的方案

只要你有账号和机器配置过关,那就黑盒使用AI。不用代理和配置。

具体就按提示步步操作吧,并非本文主要讲述,有兴趣可以自行深入尝试。

再细致来分析一下,有些公司的知识库要求是离线的,安全不泄密的,那就有许多开源的AI方案。

方案一:ollama+RAGflow

实验环境

WSL,docker desktop,

参考链接:

https://www.toutiao.com/video/7507592357345378852/?from_scene=video&log_from=40bbce258aa96_1748488530670

本地离线模型管理

ollama是本地管理各模型的,部署在容器或者本机中,这样更方便些。想增删模型和操作文件夹一样。但通过科学上网很难下载到安装包。linux的安装也是龟速的:

当下了qwen3后,本地可以开始流式对话。

使用ollama图形界面下载的模型离线保存在如下地址:

~/.ollama/models/manifests/registry.ollama.ai/library/

知识库管理

RAGFlow安装,容器式部署。和dify一样,下载源码,cd docker文件夹,然后就是docker-compose 一敲。

下面建立知识库,再建立对话聊天,配置知识库和大模型。

注意需要至少两类模型,一个是chat,一个是embedding(嵌入模型)。前者对话,后者把知识序列化接入大模型。

#登录到容器内测试连通性,可以通过hosts来支持指向。
curl http://host.docker.internal:11434/

方案二:dify的方案

以上两个方案都可以是满足了轻量级场景的。即简单的知识库,而非海量的,持续性维护的知识库。而RAGflow是主攻一隅吧。由浅入深,下面这个方案就对技术实操有较高要求了。同时,他能提供的扩展能力也是较强的。

举例来说,dify强大的就像是很长的插排,不限于一个AI的器。生态健全。dify是激活各大模型的神器。

实验环境

阿里云ECS,docker2

发布的效果

团队成员管理

注意,第一个注册是管理员,也是所有者。后面想加入成员,可以通过在系统中键入用户名,再生成邀请链接。然后,把链接发给用户。

方案三:火山引擎的产品化方案

不用懂太多的AI生态和模型功能。只要开通,申请,上传,优化,交费就行。当然,可以预付费。当然问题是知识库的保密级别要注意。

参考指导

https://www.volcengine.com/docs/82379/1261883

coze实现

技术细节更加黑盒化,但上传文档时较慢。

扣子的:https://www.cloudwego.io/zh/docs/eino/

上手实验暂时略过。

以dify的名义展示AI的肌肉

无论把dify解释成define+modify还是do it for you。
对于coder.AI+来说,却总算有装在自己“兜子”里的AI“超市”了。
好处是,上传的知识库或需要保密的资源是物理隔离了,因为是资源保存在本地服务器的。离线和实时调用千万模型皆可以。
在一切成熟后,再进入商业化,落地AI产品也不晚矣。
just take the spoon。

名词术语介绍

LLM—大语言模型
RAG—增强检索
workflow—流水线
AIGC—AI生成内容
NIG—自然语言生成
coze—火山引擎(头条旗下)的AI工厂
dify—开源的AI工厂

探索AI,鹏联实验室

如果有小伙伴想加入实验室,留言或私信,告诉你的邮箱,我发邀请链接给你。(入口如下:)

欢迎加盟


欢迎阅读AI知识库搭建文章

数字AI时代的思考

开车比不过智驾,翻译弄不过AI,写诗没有机器学习有才情,下棋也是alphaGO的手下败将。

我们不得不重新思考教育,现在孩子们要学什么,选什么专业,如何才能与AI共同进步!

请关注夜空老师,点赞收藏。

否则,狼真的来了,苦学N年后,我们也仅只是更加肥的鱼肉和绵羊,任AI宰割。被AI轻松碾压。

我们不要输在起跑线上,所以,选对学习路线最重要了。

比如说,你是家长,孩子初中。

但孩子是在打基础的阶段,碰到现在AI猛于虎也的时代。这可能是就那句老话讲的。

每个时代都有每个时代的苦难。

庆幸自己需要背单词考四级,憋小作文,以及几乎没有人用过,但只知道AI是人工智能。

在那时,努力和高考有纯正比关系的时候,人们是不浮躁的。

所以,如何在当前各种智能体中,淡泊,宁静呢?

当大家陶醉于上高速睡觉,自驾开车时。当人们提笔忘字。曾经的口语很烂但也能自信去沟通,直到所有的对话都由AI准确传达。人类到底是在进化还是在退化呢?石器时代是进化毫无异议,AI时代却有些茫然。

但历史是最完美的,AI的爆发期正在当下。

很多小伙伴们,感觉AI就像是万花筒,又像工具小超市。用户感觉AI无所不能,图像处理,文本生成……啥都有,但又好像自己怎么用都不太理想。即使你已经体验上手了某些工具,可仍然感觉像盲人摸象,不得精髓。

再比如,你是一个自媒体人,产品经理。又应该在众多智能体中如何选择。

插入小广告,欢迎大家品尝,扫码下单。

#小程序://远方好物/ESwQKnGuyLgevZm