You need to enable JavaScript to run this app.
最新活动
大模型
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

如何在存根文件中扩展h5py.File类的类型提示,使其迭代返回字符串类型

如何在存根文件中扩展h5py.File类的类型提示,使其迭代返回字符串类型

我明白你遇到的麻烦了——每次迭代h5py.File都要反复做类型转换,确实挺烦人的,尤其是静态类型检查器默认不知道迭代这个对象会返回字符串格式的键。下面我给你两个可行的解决思路,一个是快速简化现有代码,另一个是一劳永逸的存根文件方案。

先解决眼前的重复转换问题:简化代码中的类型断言

其实你完全不需要两次转换f的类型!你之前的代码里把f重新赋值为Iterable[str]之后,又在循环里转回去,这是没必要的——f的原始类型始终是h5py.File,你只需要告诉类型检查器迭代它的时候会得到字符串就行,不用改变变量本身的类型。

修改后的代码可以这样写:

from typing import cast, Iterable
import h5py

with h5py.File(computed_properties_path, "r") as f:
    computed_metrics = set()
    # 只需要在迭代时一次性断言Iterable[str],不用修改f本身的类型
    for dataset_name in cast(Iterable[str], f):
        # 这里直接用f作为h5py.File即可,类型检查器能识别它的原始类型
        dataset_group = index_hdf5(f, [dataset_name], h5py.Group)
        for metric_name in dataset_group:
            logger.info(f"Dataset: {dataset_name}, Metric: {metric_name}")

这样既解决了类型检查的问题,又避免了反复转换的冗余操作。

一劳永逸:编写正确的存根文件扩展类型提示

如果想让整个项目里的h5py.File都默认被识别为可迭代出字符串的对象,你可以编写一个正确的.pyi存根文件。之前你报错是因为存根没有正确关联原类的定义,导致类型检查器找不到File的原始实现。

步骤1:创建存根文件

在你的项目根目录(或者Python能识别的路径下)创建一个名为h5py.pyi的文件,内容如下:

# h5py.pyi
from typing import Iterator
import h5py as _original_h5py

# 继承原始的h5py.File类,只重写__iter__方法的类型提示
class File(_original_h5py.File):
    def __iter__(self) -> Iterator[str]:
        """迭代h5py.File时返回字符串类型的键"""
        ...

步骤2:确保Pylance识别存根文件

  • 如果你用VS Code,确保存根文件放在项目根目录,或者在pyproject.toml里配置stubPath指向存根所在目录:
    [tool.pyright]
    stubPath = "stubs"
    
    (如果存根放在stubs/h5py.pyi的话)

这样配置后,Pylance会优先使用你定义的存根类型,同时保留h5py.File的所有原始方法,并且知道迭代它会返回字符串,再也不用在代码里写类型断言了。

为什么你之前的存根文件报错?

你之前遇到的“File is not defined”错误,是因为存根文件没有正确导入原始的h5py.File类。如果你直接在存根里定义class File:而不继承原类,类型检查器会完全忽略原始的h5py.File定义,只使用你存根里的空类,自然找不到原类的其他方法和属性。通过继承_original_h5py.File,我们既扩展了类型提示,又保留了原类的所有功能。

备注:内容来源于stack exchange,提问作者Pro Q

火山引擎 最新活动