多语言文本翻译--AI 数据湖服务-火山引擎

文档中心

AI 数据湖服务

文本翻译

多语言文本翻译

算子介绍

描述

Seed-X 多语言文本翻译模型 - 跨语言文本翻译核心功能

核心功能

多语言智能翻译
支持多种语言间的文本转换，可通过source_language和target_language参数自定义源语言和目标语言
基于Seed-X-Instruct-7B/Seed-X-PPO-7B模型，提供高质量翻译结果
支持语种请参考: https://huggingface.co/ByteDance-Seed/Seed-X-Instruct-7B
一般场景中，推荐使用Seed-X-PPO-7B模型，其在翻译质量上效果更佳
灵活配置与优化
支持多种计算精度选择（bfloat16等），适配不同性能需求
集成张量并行处理和前缀缓存技术，显著提升推理效率
支持自动或手动设备分配，完美适配单卡/多卡环境
资源使用
推荐使用24G以上显存的GPU

场景优化

广泛适用于跨语言内容转换、多语言文档处理、国际化应用开发等场景
内置批处理机制，高效支持大规模文本数据并行翻译
支持精确控制最大生成 tokens 数量，满足多样化业务需求

Daft 调用

算子参数

输入

输入列名	说明
contents	包含待翻译文本的数组，元素类型为字符串。

输出

处理后的数组，元素为每个文本的翻译结果。对于处理失败的文本，返回空字符串。

参数

如参数没有默认值，则为必填参数

参数名称	类型	默认值	描述
model_path	str	/opt/las/models	本地模型文件存储的绝对路径，默认为容器内预置路径。当使用自定义模型时需修改此路径默认值："/opt/las/models"
model_name	str	Seed-X-PPO-7B	支持的多语言模型名称，当前支持Seed-X-Instruct-7B/Seed-X-PPO-7B系列模型可选值：["Seed-X-Instruct-7B", "Seed-X-PPO-7B"] 默认值："Seed-X-PPO-7B"
dtype	str	bfloat16	模型推理精度选择默认值："bfloat16"
max_model_len	int	32768	模型支持的最大序列长度默认值：32768
max_num_seqs	int	128	模型同时处理的最大序列数量默认值：128
tensor_parallel_size	int	1	张量并行计算的设备数量，用于多GPU并行推理默认值：1
enable_prefix_caching	bool	True	是否启用前缀缓存机制，可提升重复前缀的推理效率默认值：True
gpu_memory_utilization	float	0.9	GPU内存使用比例，范围0-1 默认值：0.9
use_cot	bool	False	是否使用思维链(Chain-of-Thought)模式进行翻译默认值：False
source_language	str	Chinese	源语言名称，支持的语言请参考模型文档默认值："Chinese"
target_language	str	English	目标语言名称，支持的语言请参考模型文档默认值："English"
max_tokens	int	1024	模型生成翻译结果的最大token数默认值：1024
batch_size	int	4	单次推理处理的文本样本数量默认值：4
seed	int	42	随机数种子，用于结果复现默认值：42

调用示例

下面的代码展示了如何使用 daft 运行算子基于Doubao模型对多语言文本进行翻译。

from __future__ import annotations

import logging
import os

import ray

import daft
from daft import col
from daft.las.functions.text.multilingual_text_translate import MultilingualTextTranslate
from daft.las.functions.udf import las_udf

if __name__ == "__main__":
    os.environ["DAFT_RUNNER"] = "ray"

    def configure_logging():
        logging.basicConfig(
            level=logging.INFO,
            format="%(asctime)s - %(name)s - %(levelname)s - %(message)s",
            datefmt="%Y-%m-%d %H:%M:%S.%s".format(),
        )
        logging.getLogger("tracing.span").setLevel(logging.WARNING)
        logging.getLogger("daft_io.stats").setLevel(logging.WARNING)
        logging.getLogger("DaftStatisticsManager").setLevel(logging.WARNING)
        logging.getLogger("DaftFlotillaScheduler").setLevel(logging.WARNING)
        logging.getLogger("DaftFlotillaDispatcher").setLevel(logging.WARNING)

    ray.init(dashboard_host="0.0.0.0", runtime_env={"worker_process_setup_hook": configure_logging})
    daft.set_runner_ray()
    daft.set_execution_config(actor_udf_ready_timeout=600)
    daft.set_execution_config(min_cpu_per_task=0)

    samples = {
        "text": [
            "这是一篇关于人工智能技术发展的高质量学术论文，内容详实且具有很强的参考价值。",
        ]
    }

    model_path = os.getenv("MODEL_PATH", "/opt/las/models")
    model_name = "Seed-X-PPO-7B"
    max_model_len = 32768
    max_num_seqs = 128
    tensor_parallel_size = 1
    dtype = "bfloat16"
    enable_prefix_caching = True
    gpu_memory_utilization = 0.9
    use_cot = False
    source_language = "Chinese"
    target_language = "English"
    max_tokens = 1024
    batch_size = 4
    seed = 42

    ds = daft.from_pydict(samples)
    ds = ds.with_column(
        "translate_text",
        las_udf(
            MultilingualTextTranslate,
            construct_args={
                "model_path": model_path,
                "model_name": model_name,
                "dtype": dtype,
                "max_model_len": max_model_len,
                "max_num_seqs": max_num_seqs,
                "tensor_parallel_size": tensor_parallel_size,
                "enable_prefix_caching": enable_prefix_caching,
                "gpu_memory_utilization": gpu_memory_utilization,
                "use_cot": use_cot,
                "source_language": source_language,
                "target_language": target_language,
                "max_tokens": max_tokens,
                "batch_size": batch_size,
                "seed": seed,
            },
            num_gpus=1,
            batch_size=1,
            concurrency=1,
        )(col("text")),
    )

    ds.show()

    # ╭─────────────────────────────────────────────────────────────┬────────────────────────────────╮
    # │ text                                                        ┆ translate_text                 │
    # │ ---                                                         ┆ ---                            │
    # │ Utf8                                                        ┆ Utf8                           │
    # ╞═════════════════════════════════════════════════════════════╪════════════════════════════════╡
    # │ 这是一篇关于人工智能技术发展的高质量学术论文，内容详实且具…           ┆ This is a high-quality academ… │
    # ╰─────────────────────────────────────────────────────────────┴────────────────────────────────╯

最近更新时间：2026.03.30 14:23:37

这个页面对您有帮助吗？

有用

无用

AI 数据湖服务

描述 #

核心功能 #

场景优化 #

算子参数 #

输入 #

输出 #

参数 #

调用示例 #

描述

核心功能

场景优化

算子参数

输入

输出

参数

调用示例