模拟热力学过程的可扩展Python计算库最佳架构选型咨询

阿华AIGC实验室

2026-4-27

针对热力学计算Python库的最佳架构方案

作为经常开发计算型Python库的人，我完全懂你纠结的点——DDD和六边形架构听起来都是为业务系统或数据密集型应用设计的，放到RDKit这种纯计算导向的库上总觉得有点“重”。但其实只要做轻量化适配，这些架构思想能完美解决你提到的扩展性需求，甚至还能借鉴RDKit本身的设计思路。

核心设计原则：围绕计算需求做轻量化架构

你的库核心需求是可扩展（新增性质、新增算法）、低耦合（算法与数据分离）、易维护（不同算法互不干扰），所以架构要紧扣这几点，不用硬套DDD或六边形的所有复杂概念，取其精华即可。

1. 用轻量化领域对象封装核心数据（DDD思想适配）

不用搞DDD里的聚合根、仓储这些复杂概念，而是把热力学计算的核心实体封装成领域对象：

定义Component类：封装单个组分的属性（摩尔质量、临界温度、偏心因子等）
定义Mixture类：封装烧瓶混合物的核心数据（组分列表、摩尔分数、温度、压力等）

所有计算器都以Mixture对象作为输入，而不是零散的参数。这样不管新增什么性质计算，都基于统一的数据结构，避免重复处理输入校验、单位转换等逻辑。

示例代码：

from dataclasses import dataclass
from typing import List

@dataclass(frozen=True)  # 冻结保证数据不可变，避免计算过程中被篡改
class Component:
    name: str
    molar_mass: float  # g/mol
    critical_temp: float  # K
    critical_press: float  # Pa

@dataclass(frozen=True)
class Mixture:
    components: List[Component]
    mole_fractions: List[float]
    temperature: float  # K
    pressure: float     # Pa

2. 用策略模式+抽象接口实现多算法扩展

这是解决“单一性质多算法”需求的最佳方案：

为每个热力学性质定义抽象基类（用abc.ABC），比如DensityCalculator、ViscosityCalculator，里面包含抽象方法calculate(mixture: Mixture) -> float
每种算法作为该抽象类的实现，比如IdealSolutionDensity、UNIFACDensity
对外提供一个注册器，允许用户新增算法或切换默认算法

这种设计下，新增算法只需要实现对应的抽象类，完全不影响现有代码；新增性质只需要添加新的抽象基类和实现类，模块间完全解耦。

示例代码：

from abc import ABC, abstractmethod

# 通用性质计算器接口
class ThermoCalculator(ABC):
    @abstractmethod
    def calculate(self, mixture: Mixture) -> float:
        pass

# 密度计算器的专属接口（可选，用于更细分的约束）
class DensityCalculator(ThermoCalculator):
    pass

# 理想溶液模型实现
class IdealSolutionDensity(DensityCalculator):
    def calculate(self, mixture: Mixture) -> float:
        # 理想溶液密度计算逻辑
        avg_molar_mass = sum(c.molar_mass * x for c, x in zip(mixture.components, mixture.mole_fractions))
        # 示例：用理想气体状态方程计算（实际热力学模型需替换为专业公式）
        return (mixture.pressure * avg_molar_mass / 1000) / (8.314 * mixture.temperature)

# UNIFAC模型实现
class UNIFACDensity(DensityCalculator):
    def calculate(self, mixture: Mixture) -> float:
        # UNIFAC模型的密度计算逻辑
        # 可以调用外部数值计算库（比如scipy），但建议封装成适配器
        pass

3. 六边形架构适配：隔离核心计算与外部依赖

六边形架构的核心是“核心逻辑与外部依赖解耦”，这点对计算型库非常有用：

核心领域：就是你的热力学计算逻辑（各种Calculator实现）
适配器：把外部依赖（比如numpy、scipy的数值计算函数、文件IO）封装成适配器接口，核心逻辑只依赖接口而非具体实现。比如如果某个算法需要用scipy的优化器，就封装一个OptimizerAdapter，核心逻辑调用这个适配器的optimize()方法，以后换用其他优化库只需要修改适配器。
驱动端口：对外提供的API入口，比如一个ThermoEngine类，负责注册计算器、接收用户请求、调度计算逻辑。

示例API入口：

class ThermoEngine:
    def __init__(self):
        self._registry = {}  # 格式：(property_type, algorithm_name) -> calculator instance

    def register_calculator(self, property_type: str, algorithm_name: str, calculator: ThermoCalculator):
        """注册新的性质计算器"""
        self._registry[(property_type, algorithm_name)] = calculator

    def calculate(self, property_type: str, algorithm_name: str, mixture: Mixture) -> float:
        """执行指定性质的计算"""
        key = (property_type, algorithm_name)
        if key not in self._registry:
            raise ValueError(f"No calculator found for {property_type} (algorithm: {algorithm_name})")
        return self._registry[key].calculate(mixture)

    def set_default_algorithm(self, property_type: str, algorithm_name: str):
        """设置某性质的默认计算算法（可选）"""
        # 实现逻辑略
        pass

用户使用示例：

# 初始化引擎
engine = ThermoEngine()

# 注册密度计算器
engine.register_calculator("density", "ideal", IdealSolutionDensity())
engine.register_calculator("density", "unifac", UNIFACDensity())

# 创建混合物对象
ethanol = Component(name="ethanol", molar_mass=46.07, critical_temp=513.9, critical_press=6137000)
water = Component(name="water", molar_mass=18.02, critical_temp=647.1, critical_press=22064000)
mixture = Mixture(
    components=[ethanol, water],
    mole_fractions=[0.3, 0.7],
    temperature=298.15,
    pressure=101325
)

# 计算密度
ideal_density = engine.calculate("density", "ideal", mixture)
unifac_density = engine.calculate("density", "unifac", mixture)

额外建议（借鉴RDKit的设计思路）

模块化组织代码：按性质分模块（比如thermolib/density/、thermolib/viscosity/），每个模块下包含算法实现、测试用例、文档，新增性质时直接添加新模块即可。
缓存计算结果：对于耗时的计算，可以为Mixture对象添加缓存（比如用functools.lru_cache），避免重复计算相同条件下的结果。
单位一致性：在领域对象里统一单位（比如温度用K、压力用Pa），对外API可以提供单位转换接口，避免用户输入单位混乱。
避免过度设计：DDD里的领域事件、仓储等概念如果用不到就不要硬套，计算型库的核心是逻辑清晰、扩展方便，轻量化才是关键。

内容的提问来源于stack exchange，提问作者Pablo Sánches González