搜索结果：LLM

为您精心筛选出最相关的优质内容

找到 12 篇相关文章

显示 12 个搜索结果

AI-炼丹 0%

LLM探索：环境搭建与模型本地部署

## 前言最近一直在炼丹（搞AIGC这块），突然发现业务代码都索然无味了… 上次发了篇AI画图的文章，ChatGPT虽然没法自己部署，但现在开源的LLM还是不少的，只要有一块差不多的显卡，要搞个LLM本地部署还是没问题的。本文将介绍这以下两个国产开源LLM的本地部署 - ChatGLM-6B - MOSS 本文先简单的把模型跑起来，后续将继续我近期在LLM方向的一些探索记录~ ## 概念...

深入阅读

2023年05月20日

AI-炼丹 0%

LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature

## 前言上一篇文章介绍了几个开源LLM的环境搭建和本地部署，在使用ChatGPT接口或者自己本地部署的LLM大模型的时候，经常会遇到这几个参数，本文简单介绍一下~ - temperature - top_p - top_k ### 关于LLM 上一篇也有介绍过，这次看到一个不错的图 > A recent breakthrough in artificial intelligence (AI...

深入阅读

2023年05月25日

C# 0%

C#使用iKvm黑科技无缝接入JVM生态

...飞快，一转眼国庆假期也要过去了，再不更新博客就太咸鱼了…… 最近在开发AIHub的时候想找个C#能用的命名实体识别库，但一直没找到，AI生态方面C#确实不太丰富，这块还是得Python，但我又不想跟LLM一样用gRPC的方式来调用，感觉有点麻烦。这时候发现好像JVM生态有不少这类NLP工具，比如 Standford NLP 、HanLP这类。所以就想到之前在网上看到的iKvm，我直接把JVM生态白...

深入阅读

2023年10月06日

AI-炼丹 0%

LLM探索：为ChatGLM2的gRPC后端增加连续对话功能

...用。主要思路还是用的 OpenAI 接口的那套，降低学习成本，但之前为了快速开发，就只搞了个简单的 gRPC 接口，还差个多轮对话功能没有实现，这次就来完善一下这个功能。 ## 简述系统分为LLM后端和客户端两部分，LLM后端使用 gRPC 提供接口，客户端就是我用 Blazor 开发的 AIHub 所以这次涉及到这几个地方的修改 - proto - 客户端 - C# 代码 - AIHub...

深入阅读

2023年10月19日

Django 0%

使用Django-Channels实现websocket通信+大模型对话

... Django 开发者可以在不离开熟悉的环境的情况下，开发出更加丰富和动态的应用。 ## 使用场景先介绍下使用场景这个 demo 项目的后端使用 StarAI 和 LangChain 调用 LLM 获取回答，然后通过 WebSocket 与前端通信，前端我选了 React + Tailwind ## 安装以 DjangoStarter 项目为例（使用 pdm 作为包管理器） ```ba...

深入阅读

2024年08月14日

项目开发小结系列 0%

项目完成小结：使用DjangoStarter v3和Taro开发的微信小程序

... 最近我开始使用 tailwindcss ，一下就喜欢上这种高效的样式工具（虽然会有很长的一串class）不过瑕不掩瑜，使用 tailwindcss 可以很方便在网络上 copy 各种样式，还能让 LLM 帮我写各种样式，生产力拉满了~ Taro 官方提供了 tailwindcss 的支持，这点非常好，跟着官方文档来就行详见官方文档: https://docs.taro.zone/docs/ta...

深入阅读

2024年09月12日

AI-炼丹 0%

LLM探索：DeepSeek火爆全网，官网宕机？本地部署一个随便玩

...多之前 ChatGPT 的遭遇颇为相似。我已经好久没有本地部署模型了（现在各厂商的模型都便宜量大），这次正好来试试 DeepSeek 开源模型的效果。 ### 关于AI大模型的扩展阅读 - [LLM探索：环境搭建与模型本地部署](https://www.cnblogs.com/deali/p/llm-1.html) - [LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Tem...

深入阅读

2025年01月30日

AI-炼丹 0%

LLM探索：使用DeepSeek免费平替cursor

## 前言去年下半年 cursor 非常火，让很多一行代码都不懂的小白，也可以做自己的网站和搭 App，当时一下子就引爆了独立开发的热潮。不过每月20dollar的价格也不算便宜，这时候可以使用 cline , aider composer + continue 之类的插件搭配其他大模型后端来实现，也能实现类似的效果。 ### 关于AI编程 AI编程现在主要有两种玩法，简单介绍下： ...

深入阅读

2025年01月31日

AI-炼丹 0%

LLM探索：大模型背后的向量魔法，Embedding技术初探

本文原本是2022年写的，然而一直没有完善😂，自从LLM火起来之后，NLP领域的技术更新很快，本文只是大概介绍了Embedding相关的基础知识，具体应用接下来会在博客更新发布。 ## 前言又是很长一段时间没更新博客了，这个暑假非常忙，也稍微做出了一点成果，接下来会继续在博客上分享~ 今年以来，大模型以及相关的应用很火，其中就有一种叫「向量数据库」的东西，向量数据库主要用来存储向量和提供向量查...

深入阅读

2025年02月07日

AI-炼丹 0%

LLM探索：离线部署Ollama和one-api服务

...epseek-r1:32b -f Modelfile ``` 如无意外就导入成功了，可以执行 `ollama list` 来查看是否已导入。 ## one-api One API 是一款开源的 LLM（大语言模型）API 管理与分发系统，旨在通过标准的 OpenAI API 格式，统一访问多种大模型，开箱即用。它支持多种主流大模型，包括 OpenAI ChatGPT 系列、Anthropic C...

深入阅读

2025年02月18日

Django 0%

Django过时了吗？从ASGI到AI时代的思考

...前踩过坑，可以参考: [使用Django-Channels实现websocket通信+大模型对话](https://blog.deali.cn/p/django-channels-websocket-llm-conversation) ## 生态与工程化但这并不意味着 Django 已经过时。相反，Django 的价值依然不可替代： - **成熟的生态**：几乎任何功能都有轮子（认证、后台、权限...

深入阅读

2025年09月12日

系统配置 0%

在Linux系统上一键配置DoH，解决DNS解析被污染

... ```bash resolvectl status ``` 可以看到以下输出 ```bash $ resolvectl status Global Protocols: -LLMNR -mDNS -DNSOverTLS DNSSEC=no/unsupported resolv.conf mode: stub DNS Servers: 127.0.0....

深入阅读

2025年10月02日