0

0

Python生成式AI教程_使用transformer模型生成文本

冷漠man

冷漠man

发布时间:2025-12-31 13:42:08

|

239人浏览过

|

来源于php中文网

原创

用Python和Transformer生成文本的核心是加载预训练模型、准备输入、调用generate接口;借助Hugging Face的transformers库,可快速通过pipeline或手动tokenizer+model实现生成,并支持temperature、top_k等参数调控及bad_words_ids等进阶控制。

python生成式ai教程_使用transformer模型生成文本

用 Python 和 Transformer 模型生成文本,核心是加载预训练模型、准备输入、调用生成接口——不需从头训练,Hugging Face 的 transformers 库让这件事变得非常直接。

安装依赖与加载基础模型

先确保安装了关键库:

  • pip install transformers torch(PyTorch 是默认后端
  • 推荐加装 accelerate 以支持显存优化和多卡推理

选一个轻量又实用的开源模型,比如 distilgpt2(GPT-2 的精简版,速度快、显存友好):

from transformers import pipeline

generator = pipeline("text-generation", model="distilgpt2")

简单生成:给提示词,得续写结果

只需一行代码就能生成文本:

立即学习Python免费学习笔记(深入)”;

培训招生教育类网站模板(响应式)1.4.2
培训招生教育类网站模板(响应式)1.4.2

培训招生教育类网站模板(响应式)安装即用,自带人人站CMS内核,支持响应式,前端banner轮播图文本均已进行可视化配置,伪静态页面生成,支持内容模型、多语言、自定义表单、筛选、多条件搜索等功能,支持多种URL模式及模型。模板特点:1、安装即用,自带人人站CMS内核及企业站展示功能(产品,新闻,案例展示等),并可根据需要增加表单 搜索等功能(自带模板) 2、支持响应式 3、前端banner轮播图文

下载
output = generator("今天天气不错,我想去", max_length=50, num_return_sequences=1)
print(output[0]["generated_text"])
  • max_length 控制总长度(含输入),不是只生成多少字
  • num_return_sequences=3 可一次返回多个不同版本,便于对比选择
  • 若想控制“创造性”,可调整 temperature=0.7(越低越保守,越高越随机)或启用 top_k=50 / top_p=0.9 进行采样过滤

进阶控制:手动 tokenizer + model 调用

当需要更精细干预(如禁止某些词、添加前缀、控制停止符),建议绕过 pipeline,直接操作模型:

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("distilgpt2")
model = AutoModelForCausalLM.from_pretrained("distilgpt2")

input_text = "Python 中列表推导式的语法是"
input_ids = tokenizer.encode(input_text, return_tensors="pt")

output_ids = model.generate(
    input_ids,
    max_new_tokens=64,
    do_sample=True,
    temperature=0.85,
    pad_token_id=tokenizer.eos_token_id
)
generated_text = tokenizer.decode(output_ids[0], skip_special_tokens=True)
  • max_new_tokens 更直观:只限制新生成的 token 数量
  • pad_token_id 设为 eos_token_id 可避免警告,尤其在 batch 推理时必要
  • 如需禁止生成特定词(如“错误”、“bug”),可用 bad_words_ids 参数传入 token ID 列表

本地部署小贴士

在消费级显卡(如 RTX 3060 12G)上跑 distilgpt2 完全没问题;若换更大模型(如 facebook/opt-1.3bgoogle/gemma-2b):

  • device_map="auto" 让 accelerate 自动分配显存
  • load_in_4bit=True 加载量化模型,显存占用直降 60%+
  • 中文任务优先选专为中文微调的模型,如 uer/roberta-base-finetuned-jd-binary-chinese(分类)或 IDEA-CCNL/Ziya-LLaMA-13B-v1(生成),别硬套英文模型

不复杂但容易忽略:生成质量高度依赖提示词(prompt)设计。一个清晰、带语境、有风格指示的开头,比调参更能提升结果可用性。

相关专题

更多
python开发工具
python开发工具

php中文网为大家提供各种python开发工具,好的开发工具,可帮助开发者攻克编程学习中的基础障碍,理解每一行源代码在程序执行时在计算机中的过程。php中文网还为大家带来python相关课程以及相关文章等内容,供大家免费下载使用。

715

2023.06.15

python打包成可执行文件
python打包成可执行文件

本专题为大家带来python打包成可执行文件相关的文章,大家可以免费的下载体验。

625

2023.07.20

python能做什么
python能做什么

python能做的有:可用于开发基于控制台的应用程序、多媒体部分开发、用于开发基于Web的应用程序、使用python处理数据、系统编程等等。本专题为大家提供python相关的各种文章、以及下载和课程。

739

2023.07.25

format在python中的用法
format在python中的用法

Python中的format是一种字符串格式化方法,用于将变量或值插入到字符串中的占位符位置。通过format方法,我们可以动态地构建字符串,使其包含不同值。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

617

2023.07.31

python教程
python教程

Python已成为一门网红语言,即使是在非编程开发者当中,也掀起了一股学习的热潮。本专题为大家带来python教程的相关文章,大家可以免费体验学习。

1235

2023.08.03

python环境变量的配置
python环境变量的配置

Python是一种流行的编程语言,被广泛用于软件开发、数据分析和科学计算等领域。在安装Python之后,我们需要配置环境变量,以便在任何位置都能够访问Python的可执行文件。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

547

2023.08.04

python eval
python eval

eval函数是Python中一个非常强大的函数,它可以将字符串作为Python代码进行执行,实现动态编程的效果。然而,由于其潜在的安全风险和性能问题,需要谨慎使用。php中文网给大家带来了相关的教程以及文章,欢迎大家前来学习阅读。

575

2023.08.04

scratch和python区别
scratch和python区别

scratch和python的区别:1、scratch是一种专为初学者设计的图形化编程语言,python是一种文本编程语言;2、scratch使用的是基于积木的编程语法,python采用更加传统的文本编程语法等等。本专题为大家提供scratch和python相关的文章、下载、课程内容,供大家免费下载体验。

698

2023.08.11

vlookup函数使用大全
vlookup函数使用大全

本专题整合了vlookup函数相关 教程,阅读专题下面的文章了解更多详细内容。

28

2025.12.30

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
最新Python教程 从入门到精通
最新Python教程 从入门到精通

共4课时 | 0.6万人学习

Django 教程
Django 教程

共28课时 | 2.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.0万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号