Make.com文本解析器Attributes.href为空,如何筛选合规链接?
Make.com链接筛选解决方案:解决元素属性提取失效及链接过滤问题
核心问题修复:解决Text parser Attributes为空的问题
先搞定href提取失效的问题,有两个可靠方案:
- 方案1:修正Text parser配置
打开Text parser模块的「高级设置」,勾选提取属性,并在「属性名称」框里填入href(留空可提取所有属性)。如果之前没开这个选项,Attributes字段自然是空的,开启后就能正常拿到链接地址。 - 方案2:跳过元素提取,直接正则抓href
如果方案1还是不行,换用Text parser的「提取正则表达式匹配项」模式,用正则<a[^>]+href="([^"]+)"直接从HTML源码里抓取href值。这种方式绕开元素属性提取的bug,直接拿到原始链接字符串。
筛选策略:先提href再筛选,比过滤完整标签更高效
优先提取href到变量后再做筛选,逻辑更清晰,也更容易调试:
- 筛选规则拆解(用Make筛选器模块实现)
用「AND」逻辑组合以下条件:- 允许规则:匹配相对路径前缀
^/(karriere|stellenangebote|jobs|about),或包含这些路径的绝对URL(可调整正则适配绝对路径,比如https://.*?/(karriere|stellenangebote|jobs|about)) - 排除规则(全部不满足):
- 链接包含
#、mailto:或javascript: - 链接后缀为
.png、.css、.jpg等静态资源(正则匹配\.(png|css|jpg|jpeg|gif|svg)$) - 链接包含
/wp-content/
- 链接包含
- 允许规则:匹配相对路径前缀
相对URL转绝对URL:聚合前统一处理
在筛选完成后、进入数组聚合器之前,用Make的URL工具模块选择「相对URL转绝对URL」:
- 填入原始网站的基础URL(比如
https://your-site.com) - 输入提取到的相对href值,模块会自动转换成标准绝对URL,避免后续处理出现路径错误。
优化过滤位置:早过滤,减少无效数据
把筛选器模块放在Text parser之后、数组聚合器之前,这样无效链接会被直接拦截,不会进入聚合环节,既节省流程运行资源,也避免后续处理冗余数据。如果用正则提取href,也可以在正则里做初步匹配,但筛选器模块的可视化配置比复杂正则更易维护。
内容的提问来源于stack exchange,提问作者Alex Lombardo




