You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

Make.com文本解析器Attributes.href为空,如何筛选合规链接?

Make.com链接筛选解决方案:解决元素属性提取失效及链接过滤问题

核心问题修复:解决Text parser Attributes为空的问题

先搞定href提取失效的问题,有两个可靠方案:

  • 方案1:修正Text parser配置
    打开Text parser模块的「高级设置」,勾选提取属性,并在「属性名称」框里填入href(留空可提取所有属性)。如果之前没开这个选项,Attributes字段自然是空的,开启后就能正常拿到链接地址。
  • 方案2:跳过元素提取,直接正则抓href
    如果方案1还是不行,换用Text parser的「提取正则表达式匹配项」模式,用正则<a[^>]+href="([^"]+)"直接从HTML源码里抓取href值。这种方式绕开元素属性提取的bug,直接拿到原始链接字符串。

筛选策略:先提href再筛选,比过滤完整标签更高效

优先提取href到变量后再做筛选,逻辑更清晰,也更容易调试:

  1. 筛选规则拆解(用Make筛选器模块实现)
    用「AND」逻辑组合以下条件:
    • 允许规则:匹配相对路径前缀 ^/(karriere|stellenangebote|jobs|about),或包含这些路径的绝对URL(可调整正则适配绝对路径,比如https://.*?/(karriere|stellenangebote|jobs|about)
    • 排除规则(全部不满足):
      • 链接包含 #mailto:javascript:
      • 链接后缀为 .png.css.jpg 等静态资源(正则匹配 \.(png|css|jpg|jpeg|gif|svg)$
      • 链接包含 /wp-content/

相对URL转绝对URL:聚合前统一处理

在筛选完成后、进入数组聚合器之前,用Make的URL工具模块选择「相对URL转绝对URL」:

  • 填入原始网站的基础URL(比如https://your-site.com
  • 输入提取到的相对href值,模块会自动转换成标准绝对URL,避免后续处理出现路径错误。

优化过滤位置:早过滤,减少无效数据

把筛选器模块放在Text parser之后、数组聚合器之前,这样无效链接会被直接拦截,不会进入聚合环节,既节省流程运行资源,也避免后续处理冗余数据。如果用正则提取href,也可以在正则里做初步匹配,但筛选器模块的可视化配置比复杂正则更易维护。

内容的提问来源于stack exchange,提问作者Alex Lombardo

火山引擎 最新活动