程序设计实验室
微信公众号
一个技术探索与知识分享的平台~
ROCm on Windows 性能排查:RX 6650 XT 跑 PyTorch,为什么加速不明显?
自编译折腾半天,加速不到2倍?小模型+Windows+gfx1032非官方支持,能有这个速度算给面子了。别指望生产环境,当实验玩具玩吧。
2026-05-09
1401
ROCm
打包ROCm环境的相关Wheel方便后续使用
呵,折腾半天才发现没法从site-packages直接提取Wheel,还得从官方源重新拖。几个G的ROCm全家桶,预编译好的二进制乐高,省得下次再对着源码干等几小时。
2026-01-18
1185
ROCm
AMD显卡也能畅玩AI画图!ROCm+ComfyUI部署全指南
用StabilityMatrix在AMD显卡上部署ComfyUI,总算让ROCm派上点正经用场。可视化工作流比早期那堆破烂配置界面强多了,虽然启动时还得手动补依赖。看着GPU利用率拉满生成图像,这才算没白折腾。
2026-01-08
578
ROCm
告别N卡CUDA垄断,Windows+AMD显卡ROCm跑深度学习:手把手实现 MNIST 手写数字识别
在Windows+AMD的debuff下硬是编译了ROCm版PyTorch,拿MNIST这种“Hello World”来验货。用CNN而不是老掉牙的全连接网络,总算对得起显卡算力。跑完500个batch损失降到0.03,这种基础任务也就测个...
2026-01-07
830
ROCm
Windows + AMD 显卡,终于能用 PyTorch 炼丹了
Windows+AMD+ROCm+PyTorch这地狱级组合居然跑通了。无非是用了官方ROCm和保守的PyTorch 2.9.1,避开新版本那些破事。下一步?总算能试试炼丹和AI画图了。
2026-01-06
1937
ROCm
Windows + AMD ROCm + PyTorch:debuff拉满的6650xt A卡炼丹折腾经历
用6650XT在Windows上跑PyTorch?AMD官方都不支持这卡,还得自己编译ROCm。折腾一晚上环境变量和编译错误,结果连个wheel都没生成出来。所以为什么非要在Windows上给A卡炼丹?
2026-01-05
1649
ROCm