从AWS IRS Form 990索引获取的object_id对应表单不符问题求助
解决IRS Form 990 Object ID指向错误公司的问题
嘿,遇到这种object ID对应错公司的情况,咱们一步步排查应该能解决,给你几个实用的建议:
优先用EIN(雇主识别号)锁定目标公司
先打开你存在桌面的~/Desktop/nhn2017.csv,别光靠公司名称找——很多机构名称有缩写、后缀差异(比如“LLC”和“Limited Liability Company”),甚至还有同名的情况,很容易选错。EIN是每个机构独有的标识符,用它来匹配对应的object ID,准确率会高很多。反向验证当前Object ID的对应记录
把你现在用的201702509349300000在csv里搜一遍,看看这条记录对应的是不是你要的目标公司:- 如果不是,说明你当初找ID的时候看错了,重新用EIN或者更精准的字段找就行;
- 如果csv里显示是目标公司,但下载的xml是别家的,那大概率是IRS S3存储里的文件映射出了问题(这种情况比较少见,但也有可能)。
确认税年与索引年份的匹配
注意index_2017.csv里的记录,有的是2017年提交的表单,但对应的税年可能是2016年。如果你要的是目标公司2017税年的表单,得检查csv里的tax_prd字段(如果存在的话)是不是2017,别把提交年份和税年搞混了。重新下载索引文件,避免本地文件损坏
有时候网络波动会导致下载的csv文件不完整或者内容错乱,建议重新下载一份干净的索引:curl https://s3.amazonaws.com/irs-form-990/index_2017.csv > ~/Desktop/nhn2017_fresh.csv用新文件重新查找object ID,再尝试下载表单。
先预览表单再保存,节省时间
找到新的object ID后,不用直接保存到桌面,先在终端预览前几十行内容,确认是不是目标公司:curl https://s3.amazonaws.com/irs-form-990/[你的新object ID]_public.xml | head -50没问题再保存就好。
内容的提问来源于stack exchange,提问作者thomasvermaak




