Bartmodelinferenceresultsafterconvertingfromhugginfacetoonnx

将huggingface中的Bart模型转换为ONNX格式，以便在C++等其他语言的应用程序中进行推理。以下是转换后的结果的代码示例：

import torch
import transformers
from transformers import BartModel, BartTokenizer

model_name = "facebook/bart-large"
model = BartModel.from_pretrained(model_name)
tokenizer = BartTokenizer.from_pretrained(model_name)
dummy_input_ids = torch.zeros([1, 1024], dtype=torch.long)
dummy_input_mask = torch.ones([1, 1024], dtype=torch.long)
dummy_input = (dummy_input_ids, dummy_input_mask)

# Export to ONNX
torch.onnx.export(model, dummy_input, "bart_large.onnx")

# Load ONNX model
import onnxruntime
ort_session = onnxruntime.InferenceSession("bart_large.onnx")

# Generate predictions
inputs = tokenizer("Hello World", return_tensors="pt")
outputs = model(**inputs)
ort_inputs = {'input_ids': inputs['input_ids'].cpu().numpy(),
              'attention_mask': inputs['attention_mask'].cpu().numpy()}
ort_outputs = ort_session.run(None, ort_inputs)

# Compare results
print(outputs.last_hidden_state.shape)
print(ort_outputs[0].shape)

通过执行上述代码，可以将huggingface中的Bart模型转换为ONNX格式，然后使用ONNXruntime库进行推理。最后，将输出与原始PyTorch模型的输出进行比较，确保结果相同。

本文内容通过AI工具匹配关键字智能整合而成，仅供参考，火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见，您可以通过联系service@volcengine.com进行反馈，火山引擎收到您的反馈后将及时答复和处理。

展开更多

开发者特惠

面向开发者的云福利中心，ECS 60元/年，域名1元起，助力开发者快速在云上构建可靠应用

ECS首年60元

社区干货

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

特惠活动

域名注册服务

cn/top/com等热门域名，首年低至1元，邮箱建站必选

￥1.00/首年起32.00/首年起

立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗，加速分发更实惠

￥2.00/年20.00/年

立即购买

Bartmodelinferenceresultsafterconvertingfromhugginfacetoonnx

开发者特惠

社区干货

特惠活动

热门爆款云服务器

域名注册服务

DCDN国内流量包100G