一个技术探索与知识分享的平台~

解决Markdig无法识别文件名带空格的图片问题

发布： 2025-09-08 05:34

更新： 2025-09-08 05:34

字数：5985

前言

昨天在发布那篇《在鸡哥14x上安装Linux：Fedora 42 上手体验》的文章时

（使用 StarBlog Publisher 发布文章时）发现其中的 webp 图片都没法自动上传

一开始我以为是没法识别 webp 格式

关于 StarBlog Publisher 工具，这是一款面向 StarBlog 的跨平台 Markdown 文章发布工具，内置多种主流大模型智能助手，支持即写即发和直观内容管理，助力高效创作。

项目开源地址: https://github.com/star-blog/starblog-publisher

更多信息可以查看这些文章：

问题解决

后来写了几个 demo 测试后才发现，是因为文件名里有空格，而 Markdig 很严格，不支持识别带空格的文件名😂，要么就是在插入图片时（Typora 里）先转义，要么就得自己处理图片解析。

文章里的图片是这样的格式

![](./2025-09-07-在鸡哥14x上安装使用Fedora42.assets/截图 2025-09-07 21-14-46.webp)

后面我修改了 starblog-publisher 分析图片的方法

做了以下改进：

使用正则表达式 @"!\[([^\]]*)\]\(([^)]+)\)" 匹配图片语法
支持路径中包含空格、中文字符等特殊字符
自动处理引号包围的路径和 URL 编码

代码

话不多说，直接上代码吧

先看原来的图片解析代码，完全使用 Markdig 来实现

/// <summary>
/// 从Markdown内容中提取所有图片路径
/// </summary>
/// <returns>图片路径数组</returns>
public string[] ExtractImagePaths() {
    if (post.Content == null) {
        return Array.Empty<string>();
    }

    var document = Markdig.Markdown.Parse(post.Content);
    var imagePaths = new List<string>();
    var baseDir = Path.GetDirectoryName(filepath) ?? "";

    foreach (var node in document.AsEnumerable()) {
        if (node is not ParagraphBlock { Inline: { } } paragraphBlock) continue;
        foreach (var inline in paragraphBlock.Inline) {
            if (inline is not LinkInline { IsImage: true } linkInline) continue;
            if (string.IsNullOrWhiteSpace(linkInline.Url)) continue;

            var imgUrl = Uri.UnescapeDataString(linkInline.Url);

            // 如果是本地图片路径，转换为绝对路径
            if (!imgUrl.StartsWith("http")) {
                // 规范化路径
                imgUrl = imgUrl.Replace('/', Path.DirectorySeparatorChar) // 统一路径分隔符
                    .Replace(".\\\\", "") // 移除相对路径前缀
                    .Replace("./", ""); // 移除相对路径前缀

                imgUrl = Path.GetFullPath(Path.Combine(baseDir, imgUrl));
                imagePaths.Add(imgUrl);
            }
        }
    }

    return imagePaths.ToArray();
}

自行实现图片解析

但 Markdig 实在是拉胯

那就只能我自己来实现解析了

也不难，用正则就可以了

/// <summary>
/// 提取带空格的图片路径（Markdig 无法正确解析的情况）
/// </summary>
/// <param name="content">Markdown 内容</param>
/// <param name="baseDir">基础目录</param>
/// <returns>图片路径列表</returns>
private List<string> ExtractImagePathsWithSpaces(string content, string baseDir) {
    var imagePaths = new List<string>();

    // 使用正则表达式匹配图片语法：![alt](path)
    // 支持路径中包含空格、中文字符等
    var imagePattern = @"!\[([^\]]*)\]\(([^)]+)\)";
    var matches = System.Text.RegularExpressions.Regex.Matches(content, imagePattern);

    foreach (System.Text.RegularExpressions.Match match in matches) {
        if (match.Groups.Count >= 3) {
            var imagePath = match.Groups[2].Value.Trim();

            // 移除可能的引号
            if ((imagePath.StartsWith('"') && imagePath.EndsWith('"')) ||
                (imagePath.StartsWith('\'') && imagePath.EndsWith('\''))) {
                imagePath = imagePath.Substring(1, imagePath.Length - 2);
            }

            // URL 解码
            imagePath = Uri.UnescapeDataString(imagePath);

            // 只处理本地路径
            if (!imagePath.StartsWith("http")) {
                // 规范化路径
                imagePath = imagePath.Replace('/', Path.DirectorySeparatorChar)
                    .Replace(".\\\\", "")
                    .Replace("./", "");

                var fullPath = Path.GetFullPath(Path.Combine(baseDir, imagePath));
                imagePaths.Add(fullPath);
            }
        }
    }

    return imagePaths;
}

补充一下原方法

然后再补充一下原来 ExtractImagePaths 方法的代码

把底部的代码改成这样

// 添加自定义解析逻辑处理带空格的图片路径
// Markdig 无法正确解析带空格的图片路径，需要手动处理
var customPaths = ExtractImagePathsWithSpaces(post.Content, baseDir);
imagePaths.AddRange(customPaths);

// 去重并返回
return imagePaths.Distinct().ToArray();

实现效果

问题解决之后，可以正常识别到所有图片了

之前我在 starblog-publisher 里做了个画廊功能，可以很方便看到文章里的所有图片

存在问题

使用正则表达式虽然简单粗暴，但有时会过于灵敏了

比如本文贴的代码里的 // 使用正则表达式匹配图片语法：![alt](path) 这一行注释，也会被识别到

就很烦，解决方法只能暂时是做成开关，由用户决定是否开启正则识别

只有当 Markdig 无法识别的情况下，才开启。然后再加一个忽略不存在的图片来解决。

开关

说干就干，我在设置里增加了一个开关

<!-- 图片解析设置卡片 -->
<Border Classes="Card">
    <StackPanel Spacing="15" Margin="15">
        <StackPanel Orientation="Horizontal" Spacing="8">
            <i:Icon Value="fa-solid fa-image" Foreground="#FF9800" />
            <TextBlock Text="图片解析设置" FontWeight="Bold" FontSize="16" />
        </StackPanel>

        <StackPanel Spacing="10">
            <ToggleSwitch OnContent="启用正则识别" OffContent="仅使用标准识别"
                          IsChecked="{Binding EnableRegexImageParsing}" />
            <TextBlock Text="启用后将使用正则表达式额外识别带空格的图片路径，但可能会过度识别。建议仅在需要处理特殊路径时开启。" 
                       TextWrapping="Wrap" 
                       FontSize="12" 
                       Foreground="{DynamicResource SystemBaseMediumColor}" 
                       Margin="0,5,0,0" />
        </StackPanel>
    </StackPanel>
</Border>

效果是这样的

不开启的情况下，识别出本文的图片就是这样的

开启之后是这样，不存在的图片，我也加了标注

跳过不存在的

在 StarBlogPublisher/Services/MarkdownProcessor.cs 的 MarkdownParse 方法里添加代码

// 检查文件是否存在，跳过不存在的图片
if (!File.Exists(imgUrl)) {
    Console.WriteLine($"跳过不存在的图片文件: {imgUrl}");
    continue;
}

小结

做一个好用的工具，就是得不断迭代优化

不过我还是得吐槽一下，Markdig 像个毛坯房一样🤣

_EOF_

解决Markdig无法识别文件名带空格的图片问题

本文作者： 程序设计实验室

本文链接： https://blog.deali.cn/p/markdig-spaces-filename-images

关于博主： 欢迎扫码关注公众号，交流技术 & 分享经验！

微信公众号：「程序设计实验室」专注于互联网热门新技术探索与团队敏捷开发实践，包括架构设计、机器学习与数据分析算法、移动端开发、Linux、Web前后端开发等，欢迎一起探讨技术，分享学习实践经验。

复古风格键盘，雷神ZERO75开箱

雷神ZERO75复古键盘，轻便786克配4000mAh电池，旋钮侧置还行。但PC键帽易沾指纹，接口内凹兼容性差，后续换PBT。带屏幕版贵200，离谱！

2024-07-09

Windows + AMD 显卡，终于能用 PyTorch 炼丹了

Windows+AMD+ROCm+PyTorch这地狱级组合居然跑通了。无非是用了官方ROCm和保守的PyTorch 2.9.1，避开新版本那些破事。下一...

2026-01-06

iPhone15ProMax简单开箱

开箱包装环保？连充电器都不给，苹果的“省钱”真是高明。质感不错，但发热烫手，单手操作？别做梦了。系统干净，但续航差，微信Bug多，与Mac协作？国产方案秒杀它。

2024-09-17

玄派玄熊猫P1鼠标开箱

旧鼠标电池漏液？又是这破事，换了个玄派玄熊猫P1。三模切换开关硬得离谱，掰过头变蓝牙模式，呵呵。按键声大得像打鼓，其他凑合吧。

2024-06-27

讨论区

共 {{total}} 条讨论

良言一句三冬暖，恶语伤人六月寒。

@{{replyComment.anonymousUser.name}}

刷新

重置

发表

首次发言：{{comment.anonymousUser.createdTime}}
网站地址：{{comment.anonymousUser.url}}

@{{comment.replyUser}} {{comment.content}}

一个技术探索与知识分享的平台~

解决Markdig无法识别文件名带空格的图片问题

前言

问题解决

代码

自行实现图片解析

补充一下原方法

实现效果

存在问题

开关

跳过不存在的

小结

解决Markdig无法识别文件名带空格的图片问题

讨论区

{{comment.anonymousUser.name}}

{{comment.anonymousUser.name}}

一个技术探索与知识分享的平台~

前言

问题解决

代码

自行实现图片解析

补充一下原方法

实现效果

存在问题

开关

跳过不存在的

小结

解决Markdig无法识别文件名带空格的图片问题

相关文章

复古风格键盘，雷神ZERO75开箱

Windows + AMD 显卡，终于能用 PyTorch 炼丹了

iPhone15ProMax简单开箱

玄派玄熊猫P1鼠标开箱

讨论区

{{comment.anonymousUser.name}}

{{comment.anonymousUser.name}}