加载中...
ROCm on Windows 性能排查:RX 6650 XT 跑 PyTorch,为什么加速不明显?
ROCm on Windows 性能排查:RX 6650 XT 跑 PyTorch,为什么加速不明显?
自编译折腾半天,加速不到2倍?小模型+Windows+gfx1032非官方支持,能有这个速度算给面子了。别指望生产环境,当实验玩具玩吧。
2026-05-09 1246
ROCm
加载中...
用本地大模型驱动中文输入法,我做了一个实验性的项目
用本地大模型驱动中文输入法,我做了一个实验性的项目
一个拿350MB小模型给输入法做语境排序的实验,思路倒是比那些堆参数的玩意儿清醒。不过老哥,先用着Web版就别急着吹原生输入法框架,等你能把打字延迟压到100ms以下再说。
2026-04-30 1002
LLM
加载中...
打包ROCm环境的相关Wheel方便后续使用
打包ROCm环境的相关Wheel方便后续使用
呵,折腾半天才发现没法从site-packages直接提取Wheel,还得从官方源重新拖。几个G的ROCm全家桶,预编译好的二进制乐高,省得下次再对着源码干等几小时。
2026-01-18 1135
ROCm
加载中...
AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南
AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南
用StabilityMatrix在AMD显卡上部署ComfyUI,总算让ROCm派上点正经用场。可视化工作流比早期那堆破烂配置界面强多了,虽然启动时还得手动补依赖。看着GPU利用率拉满生成图像,这才算没白折腾。
2026-01-08 1501
ROCm
加载中...
告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别
告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别
在Windows+AMD的debuff下硬是编译了ROCm版PyTorch,拿MNIST这种“Hello World”来验货。用CNN而不是老掉牙的全连接网络,总算对得起显卡算力。跑完500个batch损失降到0.03,这种基础任务也就测个...
2026-01-07 1505
ROCm
加载中...
Windows + AMD 显卡,终于能用 PyTorch 炼丹了
Windows + AMD 显卡,终于能用 PyTorch 炼丹了
Windows+AMD+ROCm+PyTorch这地狱级组合居然跑通了。无非是用了官方ROCm和保守的PyTorch 2.9.1,避开新版本那些破事。下一步?总算能试试炼丹和AI画图了。
2026-01-06 1941
ROCm
加载中...
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历
用6650XT在Windows上跑PyTorch?AMD官方都不支持这卡,还得自己编译ROCm。折腾一晚上环境变量和编译错误,结果连个wheel都没生成出来。所以为什么非要在Windows上给A卡炼丹?
2026-01-05 805
ROCm
加载中...
LLM探索:离线部署Ollama和one-api服务
LLM探索:离线部署Ollama和one-api服务
离线部署Ollama?手动下载上传,导入模型文件,啧,麻烦。one-api用Docker,tiktoken需下载重命名,更烦。添加渠道?简单。
2025-02-18 1259
LLM