搜索结果:LLM

为您精心筛选出最相关的优质内容

找到 12 篇相关文章
显示 12 个搜索结果
AI-炼丹 0%

LLM探索:环境搭建与模型本地部署

## 前言 最近一直在炼丹(搞AIGC这块),突然发现业务代码都索然无味了… 上次发了篇AI画图的文章,ChatGPT虽然没法自己部署,但现在开源的LLM还是不少的,只要有一块差不多的显卡,要搞个LLM本地部署还是没问题的。 本文将介绍这以下两个国产开源LLM的本地部署 - ChatGLM-6B - MOSS 本文先简单的把模型跑起来,后续将继续我近期在LLM方向的一些探索记录~ ## 概念...
AI-炼丹 0%

LLM探索:GPT类模型的几个常用参数 Top-k, Top-p, Temperature

## 前言 上一篇文章介绍了几个开源LLM的环境搭建和本地部署,在使用ChatGPT接口或者自己本地部署的LLM大模型的时候,经常会遇到这几个参数,本文简单介绍一下~ - temperature - top_p - top_k ### 关于LLM 上一篇也有介绍过,这次看到一个不错的图 > A recent breakthrough in artificial intelligence (AI...
C# 0%

C#使用iKvm黑科技无缝接入JVM生态

...飞快,一转眼国庆假期也要过去了,再不更新博客就太咸鱼了…… 最近在开发AIHub的时候想找个C#能用的命名实体识别库,但一直没找到,AI生态方面C#确实不太丰富,这块还是得Python,但我又不想跟LLM一样用gRPC的方式来调用,感觉有点麻烦。 这时候发现好像JVM生态有不少这类NLP工具,比如 Standford NLP 、HanLP这类。所以就想到之前在网上看到的iKvm,我直接把JVM生态白...
AI-炼丹 0%

LLM探索:为ChatGLM2的gRPC后端增加连续对话功能

...用。 主要思路还是用的 OpenAI 接口的那套,降低学习成本,但之前为了快速开发,就只搞了个简单的 gRPC 接口,还差个多轮对话功能没有实现,这次就来完善一下这个功能。 ## 简述 系统分为LLM后端和客户端两部分,LLM后端使用 gRPC 提供接口,客户端就是我用 Blazor 开发的 AIHub 所以这次涉及到这几个地方的修改 - proto - 客户端 - C# 代码 - AIHub...
Django 0%

使用Django-Channels实现websocket通信+大模型对话

... Django 开发者可以在不离开熟悉的环境的情况下,开发出更加丰富和动态的应用。 ## 使用场景 先介绍下使用场景 这个 demo 项目的后端使用 StarAI 和 LangChain 调用 LLM 获取回答,然后通过 WebSocket 与前端通信,前端我选了 React + Tailwind ## 安装 以 DjangoStarter 项目为例(使用 pdm 作为包管理器) ```ba...
项目开发小结系列 0%

项目完成小结:使用DjangoStarter v3和Taro开发的微信小程序

... 最近我开始使用 tailwindcss ,一下就喜欢上这种高效的样式工具(虽然会有很长的一串class)不过瑕不掩瑜,使用 tailwindcss 可以很方便在网络上 copy 各种样式,还能让 LLM 帮我写各种样式,生产力拉满了~ Taro 官方提供了 tailwindcss 的支持,这点非常好,跟着官方文档来就行 详见官方文档: https://docs.taro.zone/docs/ta...
AI-炼丹 0%

LLM探索:DeepSeek火爆全网,官网宕机?本地部署一个随便玩

...多之前 ChatGPT 的遭遇颇为相似。 我已经好久没有本地部署模型了(现在各厂商的模型都便宜量大),这次正好来试试 DeepSeek 开源模型的效果。 ### 关于AI大模型的扩展阅读 - [LLM探索:环境搭建与模型本地部署](https://www.cnblogs.com/deali/p/llm-1.html) - [LLM探索:GPT类模型的几个常用参数 Top-k, Top-p, Tem...
AI-炼丹 0%

LLM探索:使用DeepSeek免费平替cursor

## 前言 去年下半年 cursor 非常火,让很多一行代码都不懂的小白,也可以做自己的网站和搭 App,当时一下子就引爆了独立开发的热潮。 不过每月20dollar的价格也不算便宜,这时候可以使用 cline , aider composer + continue 之类的插件搭配其他大模型后端来实现,也能实现类似的效果。 ### 关于AI编程 AI编程现在主要有两种玩法,简单介绍下: ...
AI-炼丹 0%

LLM探索:大模型背后的向量魔法,Embedding技术初探

本文原本是2022年写的,然而一直没有完善😂,自从LLM火起来之后,NLP领域的技术更新很快,本文只是大概介绍了Embedding相关的基础知识,具体应用接下来会在博客更新发布。 ## 前言 又是很长一段时间没更新博客了,这个暑假非常忙,也稍微做出了一点成果,接下来会继续在博客上分享~ 今年以来,大模型以及相关的应用很火,其中就有一种叫「向量数据库」的东西,向量数据库主要用来存储向量和提供向量查...
AI-炼丹 0%

LLM探索:离线部署Ollama和one-api服务

...epseek-r1:32b -f Modelfile ``` 如无意外就导入成功了,可以执行 `ollama list` 来查看是否已导入。 ## one-api One API 是一款开源的 LLM(大语言模型)API 管理与分发系统,旨在通过标准的 OpenAI API 格式,统一访问多种大模型,开箱即用。 它支持多种主流大模型,包括 OpenAI ChatGPT 系列、Anthropic C...
Django 0%

Django过时了吗?从ASGI到AI时代的思考

...前踩过坑,可以参考: [使用Django-Channels实现websocket通信+大模型对话](https://blog.deali.cn/p/django-channels-websocket-llm-conversation) ## 生态与工程化 但这并不意味着 Django 已经过时。相反,Django 的价值依然不可替代: - **成熟的生态**:几乎任何功能都有轮子(认证、后台、权限...
系统配置 0%

在Linux系统上一键配置DoH,解决DNS解析被污染

... ```bash resolvectl status ``` 可以看到以下输出 ```bash $ resolvectl status Global Protocols: -LLMNR -mDNS -DNSOverTLS DNSSEC=no/unsupported resolv.conf mode: stub DNS Servers: 127.0.0....