---
title: GTX1080TIよお前はまだ戦える
tags: 
author: [のーひこ](https://www.docswell.com/user/nohikomiso)
site: [Docswell](https://www.docswell.com/)
thumbnail: https://bcdn.docswell.com/page/GJ8DGLRLJD.jpg?width=480
description: GTX1080TIよお前はまだ戦える by のーひこ
published: June 19, 26
canonical: https://www.docswell.com/s/nohikomiso/ZQ2XD7-2026-06-19-192800
---
# Page. 1

![Page Image](https://bcdn.docswell.com/page/GJ8DGLRLJD.jpg)



# Page. 2

![Page Image](https://bcdn.docswell.com/page/LJLMGLKQER.jpg)



# Page. 3

![Page Image](https://bcdn.docswell.com/page/47MYQM8K7W.jpg)



# Page. 4

![Page Image](https://bcdn.docswell.com/page/P7R98V56E9.jpg)



# Page. 5

![Page Image](https://bcdn.docswell.com/page/PJXQ8ZKD7X.jpg)



# Page. 6

![Page Image](https://bcdn.docswell.com/page/3JK9K85DJD.jpg)



# Page. 7

![Page Image](https://bcdn.docswell.com/page/LE3WZ2KPE5.jpg)



# Page. 8

![Page Image](https://bcdn.docswell.com/page/8EDKRZ337G.jpg)



# Page. 9

![Page Image](https://bcdn.docswell.com/page/V7PKWD4PJ8.jpg)

推論速度の実測検証： Gemma 4 &amp; Qwen 3.6
1. 入力 (Prefill) 速度：コンテキスト長による変化
モデル
処理コンテキスト長 / 条件
プレフィル速度
Gemma 4
短文プロンプト
373.0 t/s
Gemma 4
32K (3.2万トークン)
131.3 t/s
Gemma 4
128K超長文 (13万トークン)
~196.9 t/s
Qwen 3.6
128K超長文 (13万トークン)
~217.3 t/s
2. 生成 (Generation) 速度：MTPによる高速化
モデル (量子化 )
Gemma 4
(Q4_K_XL)
Qwen 3.6
(Q3_K_XL)
Qwen 3.6
(Q3_K_XL)
シナリオ / 上限
プレーン
MTP有効 (n_max)
向上率
日常対話 (128K)
48.9 t/s
51.0 t/s (n=1)
+4.3%
日常対話 (32K)
24.8 t/s
31.4 t/s (n=2)
+26.6%
128K超長文生成
~10.4 t/s
~26.2 t/s (n=2)
約2.5倍
#niigata_5min_tech


# Page. 10

![Page Image](https://bcdn.docswell.com/page/2JVV81XVJQ.jpg)



# Page. 11

![Page Image](https://bcdn.docswell.com/page/5EGL52V1JL.jpg)



