免费打造个人专属的高颜值本地大模型AI助手,无限量使用 Ollama+LobeChat开源工具,在本地运行AI大模型,安全的和AI对话。

文章目录

    • 1、安装ollama
    • 2、下载模型
    • 3、安装lobechat
    • 4、卸载Ollama

1、安装ollama

第一步,首先安装ollama,选择对应系统的安装包

ollama官网地址:https://ollama.com/

在这里插入图片描述
在这里插入图片描述
本问是lunix系统上安装ollama:

curl -fsSL https://ollama.com/install.sh | sh

在这里插入图片描述
在这里插入图片描述
如果机子没有GPU显卡的话,ollama会提示只通过cpu模式运行。

测试ollama命令:

ollama --help

在这里插入图片描述

想要流畅运行,推荐配置:

  • 4b的模型:8GB内存。

  • 7b的模型:16GB内存。

  • 13b模型: 32GB内存。

  • 70b模型:64GB内存,32也能跑,太卡。

在这里插入图片描述

2、下载模型

ollama支持的LLM模型很多:
https://ollama.com/library

第二步,下载model,本文选择下载阿里的通义千问模型:
在这里插入图片描述
在这里插入图片描述
这里选择4b参数的模型:
在这里插入图片描述

ollama run qwen:4b

在这里插入图片描述

ollama会自动帮我们下载模型和启动模型。
模型下载完成后,可以发送一条消息测试:
在这里插入图片描述
修改ollama环境变量:

#找到服务的单元文件:
#/etc/systemd/system/目录下
sudo vi /etc/systemd/system/ollama.service
 
#添加环境变量:
[Service]
Environment="OLLAMA_HOST=0.0.0.0:11434"
#如果已经有
Environment="PATH=xxx:/root/bin" "OLLAMA_HOST=0.0.0.0:11434"
 
#为了使更改生效,您需要重新加载systemd的配置。使用以下命令:
sudo systemctl daemon-reload
 
 
#最后,重启服务以应用更改:
sudo systemctl restart ollama
 

使用命令行操作不太方便,使用下面的lobe chat进行界面化操作。

3、安装lobechat

Lobe Chat:现代化设计的开源 ChatGPT/LLMs 聊天应用与开发框架,支持语音合成、多模态、可扩展的(function call)插件系统,一键免费拥有你自己的 ChatGPT/Gemini/Claude/Ollama 应用。

lobe chat参考地址:https://github.com/lobehub/lobe-chat/blob/main/README.zh-CN.md

使用docker方式进行安装:

docker run -d -p 3210:3210 -e OLLAMA_PROXY_URL=http://host.docker.internal:11434/v1 lobehub/lobe-chat
#你在自己的私有设备上部署 LobeChat 服务。使用以下命令即可使用一键启动 LobeChat 服务:

$ docker run -d -p 3210:3210 \
  -e OPENAI_API_KEY=sk-xxxx \
  -e ACCESS_CODE=lobe66 \
  --name lobe-chat \
  lobehub/lobe-chat

在这里插入图片描述
开通3210端口,进行访问测试:

在这里插入图片描述
配置lobe chat:

首先将模型切换到我们下载好的qwen 4b模型:
点击设置—选择语言模型
在这里插入图片描述
在这里插入图片描述

ollama完全兼容openai的接口,在接口代理地址中输入我们的ollama地址。

http://host.docker.internal:11434/v1

  • 如果是docker的话,用 http://host.docker.internal:11434/v1
  • 手动的话,就用 http://localhost:11434/v1 或者 http://127.0.0.1:11434/v1

如果是跑4b,7b等小模型,普通电脑就可以了,如果要跑32b比较大的,最好是有GPU,还要显存比较大
硬盘没啥要求,比如4b的模型,才2.3GB而已,30b的也就30GB左右,完全不用担心磁盘.

4、卸载Ollama

如果您决定不再使用Ollama,可以通过以下步骤将其完全从系统中移除:

停止并禁用服务:

sudo systemctl stop ollama
sudo systemctl disable ollama

删除服务文件和Ollama二进制文件:

sudo rm /etc/systemd/system/ollama.service 
sudo rm $(which ollama)

清理Ollama用户和组:

sudo rm -r /usr/share/ollama
sudo userdel ollama
sudo groupdel ollama

在这里插入图片描述


每一次的跌倒,都是对未来的一次深情拥抱。


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/549055.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python对txt文本文件内容进行替换,以便通过Origin进行数据分析

因为要使用Origin进行数据分析,数据集为单行文本逗号隔开,无法直接复制粘贴到Origin中,故为此整理了一下代码,方便后续直接使用。 一、任务需求 有个1.txt文档文件里面是一行数据信息,要将其规整为每行一个数据&…

排序:冒泡排序,直接插入排序,简单选择排序,希尔排序,快速排序,堆排序,二路归并排序

目录 一.冒泡排序 代码如下 冒泡排序时间复杂度分析 二.直接插入排序 直接插入排序时间复杂度分析 直接插入排序优化:折半插入排序 三.简单选择排序 简单选择排序优化:双向选择排序 选择排序时间复杂度 双向选择排序时间复杂度 四.希尔排序 希…

Java反序列化基础-类的动态加载

类加载器&双亲委派 什么是类加载器 类加载器是一个负责加载器类的对象,用于实现类加载的过程中的加载这一步。每个Java类都有一个引用指向加载它的ClassLoader。而数组类是由JVM直接生成的(数组类没有对应的二进制字节流) 类加载器有哪…

贝锐蒲公英企业路由器X5 Pro:无需专线和IT人员,分钟级异地组网

尽管我们公司规模较小,只有十几个人,但为了确保项目资料的安全,依旧在公司内部自建了文件存储服务器和办公系统。 但是,随着项目数量的增加,大家出差办公的情况也愈发普遍,如何解决远程访问内部系统成了问…

公司聚会计划:最优宾客名单的算法设计与分析

公司聚会计划:最优宾客名单的算法设计与分析 问题描述算法设计C代码实现时间复杂度分析空间复杂度分析结论 在组织公司聚会时,一个重要的考虑因素是如何确保聚会的愉快氛围。在本问题中,公司主席希望在聚会上避免员工及其直接主管同时出席&am…

Python写FTP文件自动传输脚本

FTP(File Transfer Protocol)是一种用于文件传输的标准协议,当我们需要上传或下载文件时,经常会使用 FTP。如果每天需要上传或下载大量文件,手工操作无疑是一件费时费力的事情。在本篇文章中,我们将向您介绍…

中国建筑模板出口供应商

随着"一带一路"倡议的深入推进,中国基建企业"走出去"的步伐正在加快。与之相应,建筑模板产品作为工程建设的重要材料,其国际化供应也愈发受到重视。在众多建筑模板生产企业中,贵港市能强优品木业有限公司以其卓越的产品质量和丰富的出口经验,成为了国内知名…

sed 字符替换时目标内容包含 特殊字符怎么处理

背景 想写一个自动修改配置的脚本,输入一个 mysql jdbc 的连接路径,然后替换目标配置中的模版内容,明明很简单的一个内容,结果卡在了 & 这个符号上。 & 到底是什么特殊字符呢?结论:它代表要替换的…

GmSSL-3.1.1编译

1.源码下载: 下载地址:https://github.com/guanzhi/GmSSL/releases选择对应版本下载。 ​ 2.选择要下载的源码包: ​ 2.编译: 2.1 windows编译:打开vs命令行,选择想要编译的版本,x86或x64…

大数据、数据架构、推荐冷启动...小红书的 AI 数据新方案都在这个会

伴随着行业数据持续积累,人工智能正加速渗透各类场景,大数据、数据架构和推荐系统等领域,依然是各行各业目之所聚。4 月 19 至 20 日,「DataFunCon 2024 上海站」来袭!大会以“数聚垂域,智领未来”为主题…

数据结构——栈(C++实现)

数据结构——栈 什么是栈栈的实现顺序栈的实现链栈的实现 今天我们来看一个新的数据结构——栈。 什么是栈 栈是一种基础且重要的数据结构,它在计算机科学和编程中扮演着核心角色。栈的名称源于现实生活中的概念,如一叠书或一摞盘子,新添加…

AI概念普及-LangChain

文章目录 概念产品架构核心特性核心组件使用场景其他资源开发支持结论Langchain详细介绍LangChain的具体实现原理LangChain如何与其他大型语言模型(LLM)集成,有哪些具体的接口或协议?LangChain的性能表现和优化策略有哪些&#xf…

由于找不到msvcr120.dll,无法继续执行代码的详细处理方法,教你快修复msvcr120.dll

DLL文件,全称动态链接库文件,在计算机系统中具有重要作用。其中,msvcr120.dll是一个常见的DLL文件,它关联了许多程序和应用的正常运行。本指南将深入解释 msvcr120.dll文件的功能,并阐述如果缺少该文件会引起什么样的问…

Banana Pi开源社区推出BPI-5202开发板,国产龙芯Loongson 2K1000LA

BPI-5202开发板,国产龙芯Loongson 2K1000LA BPI-5202作为单纯的嵌入式通用控制器软硬件开发平台,采用龙芯2K1000LA芯片设计,基本配置中有2个独立MAC以太网端口、2个RS485端口1个RS232端口2个CAN2.0端口,配置灵活,广泛适…

# ABAP SQL 字符串处理-CONCATCAST

经常我都要在ABAP的sql语句中对字符串进行处理,现在就总结一下可以用到的方法 文章目录 字符串处理拼接字段运行结果 填充字符串运行结果 截取字符串 SUBSTRING运行结果 CAST转换类型程序运行结果 CAST 转换成 DATS类型(日期) 字符串处理 在…

客户案例:金蝶云星空对接纷享销客

正文:某国内食品贸易类客户,目前内部使用了多套系统。金蝶云星空ERP,纷享销客,钉钉,旺店通等系统。金蝶云星空作企业的业务财务一体化管理,与专业CRM平台纷享销客的战略合作,在产品管理、客户关…

Java智慧工地可视化管理云平台源码 施工进度、施工质量

目录 1、基础数据管理 2、考勤管理 3、安全隐患管理 4、视频监控 5、塔吊监控 6、升降机监控 7、管理分析报表 8、移动端数据推送 9、数据接收管理 慧工地全套源码(PC端,移动端,大屏端) 智慧工地系统利用APP监管施工现场…

SQL注入利用学习 - 延时盲注

延时盲注原理 无法利用页面显示结果判断SQL注入是否执行成功,此时可以利用 SQL语句执行的延时 判断SQL是 否执行成功。 只要可以执行延时,那么就可以利用该注入技术。 sql时间类型的盲注本质是利用插入的SQL语句执行造成时间延迟,插入的SQ…

软件测试中完整的Web请求流程

在软件开发的过程中,测试是一个至关重要的环节。而在现代互联网应用中,Web请求是很常见的一个测试需求。本文将介绍Web请求的完整测试流程,帮助读者更好地理解软件测试的关键步骤。 一、测试准备阶段 在进行Web请求测试之前,测试…

IK分词器安装、配置、分词自定义、Rest使用、SpringBoot使用

文章目录 1. 概述2. 安装配置3. 自定义拆分文本4. 调用4.1 拆分规则4.2 Rest 调用4.3 SpringBoot 调用 1. 概述 IK分词器是ElasticSearch(es)的一个最最最有名插件,能够把一段中文或者别的语句划分成一个个的关键字,进而在搜索的时候对数据库中或者索引库…
最新文章