9cubed
ブログ | Tailwind | Vite | Python | MariaDB | Node.js | Linux | PowerShell | Docker | Git | その他 | 将棋ウォーズ | 歌の練習
< 前の記事

音声から文字起こし

次の記事 >

pipeline で文章の生成

Python

[Python]pipeline で文章の要約

公開日:2025-12-19
更新日:2025-12-19

1. 概要

pipeline を使用して、文章の要約を自動生成します。

2. パッケージのインストール

コマンド
pip install torch
pip install transformers

3. コード

実行後、フリーズしたようになりますが、エラーにならない限り動いてるので、完了までお待ちください。

コード
# 要約対象の文章
text = """
Python(パイソン)は、プログラミング言語の一種です。
1991年にグイド・ヴァン・ロッサム(Guido van Rossum)によって開発され、現在も広く使われている人気の高い言語です。
コードがシンプルで、英語に近い文法なので初心者でも学びやすく、
ウェブ開発、データ分析、人工知能(AI)、機械学習、自動化スクリプト、科学計算など、さまざまな分野で使われています。
標準ライブラリが充実していて、さらに外部ライブラリ(例:NumPy, Pandas, TensorFlow, Djangoなど)がたくさんあるので、少ないコードで高度なことを実現できます。
Pythonは、Windows、macOS、Linuxなどで動かすことができます。
コードを書いたらすぐに実行できるインタプリタ型です。
"""

from transformers import pipeline

# 日本語要約パイプラインの作成
generator = pipeline('summarization', model='tsmatz/mt5_summarize_japanese')

# 要約
summary = generator(text, max_length=100, min_length=50, do_sample=False, num_beams=8)
# max_length 生成するテキストの最大の長さ。
# min_length 生成するテキストの最小の長さ。短すぎるのを防ぐ。
# do_sample  False:毎回同じ結果になりやすい  True:ランダムの要素が入り、毎回結果が変わる可能性がある。創造的なものになる可能性がある。
# num_beams  4:標準    6~8:高品質   10 高品質+少し

print(summary[0]['summary_text'])

4. ダウンロードしたモデルの使用

pipeline で使用するモデルは、初回実行時にHugging Face Hub からダウンロードされます。
2回目以降はダウンロードしたモデルのファイルが使われます。
ファイルの保存先は、デフォルトでは C:\Users\{ユーザ名}\.cache\huggingface\hub です。

ファイルの保存先を変更する場合は、os.environ['HF_HUB_CACHE'] にパスを設定します。
必ず import pipeline 前に設定してください。
コード
import os
os.environ['HF_HUB_CACHE'] = 'e:/python/cache' 

from transformers import pipeline

実行後にモデルの保存先のフォルダを確認すると、snapshots フォルダ配下に、
316152de8d5bbc8b5ab274d930a3c0d736488052 のようなフォルダが作成されます。
これがモデルのファイルです。

このフォルダのパスを pipeline() の引数の model に指定すると、ダウンロードしておいたモデルを使って実行することができます。
コード
generator = pipeline('summarization', model='E:/python/cache/models--tsmatz--mt5_summarize_japanese/snapshots/316152de8d5bbc8b5ab274d930a3c0d736488052')

5. オフラインモード(ダウンロードの停止)

pipeline() の引数の model をモデル名にしていた場合、
モデルの新しいバージョンが公開されると、別のフォルダが作成されて、またモデルがダウンロードされます。
ダウンロードしないようにするには、import pipeline の前に、次の設定をしてください。
コード
os.environ['HF_HUB_OFFLINE'] = '1' # オフラインモード。モデルのファイルがない場合はエラー
< 前の記事

音声から文字起こし

次の記事 >

pipeline で文章の生成

YouTube X

新着一覧

  • テーブル結合(CROSS JOIN、INNER JOIN、LEFT JOIN)MariaDB
  • 楽観ロック・悲観ロックMariaDB
  • カレントリードMariaDB
  • インデックスMariaDB
  • 論理削除(ソフトデリート)MariaDB
  • awk(オーク)の使い方についてLinux
  • NOT NULL 制約と NULL を許容した時の動作MariaDB
  • 外部キー制約MariaDB
  • MySQL と MariaDB の関係MariaDB
  • Docker で PostgreSQL のコンテナの使用Linux

アーカイブ

  • 2026/01
  • 2025/12
  • 2025/11
  • 2025/10
  • 2025/09
  • 2025/08
  • /00

以前のカテゴリー一覧

  • CakePHP3
  • CentOS7
  • HTML・CSS・JavaScript
  • Haskell
  • JavaScript
  • Kotlin
  • Laravel5
  • PHP
  • Python
  • Ruby
  • RubyOnRails5
  • TypeScript
  • Vue.js
  • Webサーバ講座
  • Webプログラミング講座
  • jQuery
  • linux
  • パソコン講座
  • ブログ
  • プログラミング講座
  • メモ帳作成講座
  • 数学

Copyright © 9cubed. All Rights Reserved.

プライバシーポリシー 利用規約
▲