Python脚本无法将爬虫结果写入Excel对应列的技术求助

阿华AIGC实验室

2026-5-15

解决OpenPyXL写入Excel时图片链接错位的问题

嘿，我明白你的困扰了——你现在的脚本把爬取到的图片链接都追加到了Excel表格的末尾，而不是对应电影名的右侧列。问题出在你用了ws.append(data)这个方法，它的作用是在工作表最后添加新行，自然会导致链接和电影名不在同一行。

别担心，只需要改一行核心代码就能解决这个问题，同时我还会给你加一些鲁棒性优化，避免脚本因为意外情况崩溃。

修正后的完整代码

import requests
from bs4 import BeautifulSoup
from openpyxl import load_workbook

wb = load_workbook('item.xlsx')
ws = wb['Sheet1']

for row in range(1, ws.max_row + 1):
    input_val = ws["A" + str(row)].value
    if not input_val:  # 跳过空行，避免白忙活
        continue
    
    response = requests.get("http://www.boxofficemojo.com/search/?", params={'q': input_val})
    soup = BeautifulSoup(response.text, "lxml")
    
    try:
        table = soup.select("table")[1]
        # 取目标行（因为你用了[4:5]切片，只会有一个元素，不用循环）
        target_row = table.select('tr')[4]
        # 提取图片链接
        img_links = [img['src'] for img in target_row.select('td img')]
        
        # 关键修改：直接写入当前行的B列，而不是追加新行
        if img_links:
            ws[f"B{row}"] = img_links[0]
    except IndexError:
        # 万一找不到表格、目标行或者图片，给个提示，别让脚本崩了
        ws[f"B{row}"] = "未获取到图片链接"

wb.save("new_one.xlsx")

为什么原来的代码不行？

你之前用的ws.append(data)是OpenPyXL里用来在工作表末尾添加整行数据的方法，所以每次循环都会把图片链接放到表格最后一行，就出现了你看到的“电影名全在上面，链接全在下面”的情况。

核心修改点

替换追加为直接定位单元格：
用ws[f"B{row}"] = img_links[0]代替ws.append(data)，f"B{row}"会动态生成当前循环行的B列地址（比如第1行对应B1，第2行对应B2），直接把链接写入到电影名的右侧。
增加异常处理：
加了try-except块，防止因为网页结构变化（比如找不到第2个表格、目标行不存在）导致脚本直接崩溃，同时在B列标注异常提示。
空值检查：
先判断input_val是否为空，跳过空行，避免发送无效的请求。