369 Views
June 22, 23
スライド概要
2022年7月に開催されたJANOG50での「マンガ海賊版サイトの技術要素と対策法」における登壇資料です。オリジンサーバやキャッシュサーバを用いた、マンガ海賊版サイトの基本構成について解説し、巧みなCDN悪用方法を明らかする。マンガ海賊版サイトは、コンテンツ量が少なく、サイトテンプレートがあるため容易に開設できるが、その一方でキャッシュサーバを用いたことによるCDNの利用が多いことが分かりました。
Jストリームは、海賊版サイト・技術検証チームの一員として、海賊版サイトにおけるCDN活用の現状について発表しました。
1997年の設立以来、動画配信を主軸に事業展開。コーポレートメッセージ「もっと素敵な伝え方を。」を掲げ、テクノロジーを通じて世の中のコミュニケーションをよりよくすることを目指しています。 自社で保有・運営する独自のコンテンツ配信ネットワーク(CDN=Content Delivery Network)を活用した動画配信に加え、長年のノウハウを活かした動画の企画・制作・運用やWebサイト制作、システム開発、動画広告による収益化支援まで総合的なサービスとソリューションを提供。取引実績はメディア、大手企業をはじめ年間1,200社・10,000案件以上です。手がける技術領域は、ネットワークの物理層からアプリケーション層にわたり、日本屈指の大規模配信や最先端案件の実績も多数あります。 エンジニア向けオウンドサイト「Voice」公開中! https://voice.stream.co.jp/
JANOG50 マンガ海賊版サイトの技術要素と対策 株式会社Jストリーム 海賊版対策 技術検証チーム • マンガ海賊版サイトとCDNの関係 • マンガ海賊版サイトの規模感、基本構成 • CDNの上手な使い方 2022年7月13日 © J-Stream Inc. All Rights Reserved. 株式会社Jストリーム
自己紹介 ▶名前:N.T. ▶出身地:山形県天童市 ▶所属:株式会社Jストリーム (AS24253) ◼ 新卒でJストリーム入社 ▶お仕事 • CDN(Content Delivery Network)の構築、運用 • CDNや動画プラットフォームのプロダクト企画 ▶おうちネットワーク • 24Uの19インチラックじゃ足りない?! • ロードバランサー → 家にBIG-IP © J-Stream Inc. All Rights Reserved. 2
マンガ海賊版サイトとCDNの関係 ▶CDNとは、画像や動画などの大容量のデータを効率よく配信する仕組み ▶CDN事業者が、なぜマンガ海賊版サイト対策をしているの? ⇒ 多くのマンガ海賊版サイトでCDNが利用されている 配信サーバにデータをキャッ シュしているため負荷がかかり にくい CDNの配信サーバにデータを一 時的に記憶(キャッシュ) 多数の配信サーバで構成したCDN • コンテンツをキャッシュす ることにより、オリジンが どこにあっても高速な配信 ができる • コンテンツ配信に特化して いるので、低コストで高品 質なコンテンツ配信が可能 エンドユーザーへ、最適経路 で効率的にコンテンツを配信 ISP障害時は 他のISPへ誘導 © J-Stream Inc. All Rights Reserved. 3
マンガ海賊版サイトの規模感 ▶サイトの規模について ◼例として海賊版サイトAの2021年11月における訪問数等の情報 ◼Similarwebによる調査 大量の配信をビジネス化するため にCDNサービスは不可欠。 1カ月の合計訪問数 1億8000万 配信品質とコストの最適化を 平均滞在時間 27分23秒 CDNが担ってしまっている ページビュー/訪問 1ページ当たりのサイズ 14.38ページ 18.59MB 最小で411KB, 最大で622KB 平均:33イメージ 月間流量 15.48PB (画像を最小 0.4kbとして算出) ピーク帯域 (想定) 123Gbps (訪問者の10%がアクセス集中した想定) 参考文献:インターネット上の海賊版サイトへのアクセス抑止方策に関する検討会(第8回)配布資料 https://www.soumu.go.jp/main_content/000816834.pdf © J-Stream Inc. All Rights Reserved. 4
マンガ海賊版サイトの基本構成 動画サイトと比べて、コンテンツ量が少 なく、サイトテンプレートもあり、配信 部分を工夫すれば容易に開設できる ⇒1,000以上のサイトが乱立 ▶オリジンサーバ ◼コンテンツ量:平均200ページ(10TB以下) ◼ほぼWordPressが利用されている ⇒ マンガ海賊版サイトのテンプレデータとしてやり取りされている可能性 ▶キャッシュサーバ ◼上位サイトはほぼ単一の(ワールドワイドに展開している)CDN事業者を利用 ◼無料で利用できる(流量や機能の範囲が広い) ◼利用者の身元確認の甘さ Internet オリジン サーバー Internet CDNキャッ シュサーバー © J-Stream Inc. All Rights Reserved. GSLB エンドユーザー 5
CDNの上手な使い方 ▶複数のCDN(契約)を割り振るようなフロントの制御 ◼キャッシュヒット率の向上施策 ◼無料枠をうまく使いこなすための施策 CDNのことを理解して使っていると考えられる JSファイルで画像ファイルを 複数のCDNにアクセス分散 <figure class=“wp-block-image”><script src=“/cdncgi/scripts/7d0fa10a/xxxxx-static/rocket-loader.xxx.js” data-cfsettings=“33722ef9b67fd8f48beebb2f-|49”></script><img cdnsrc=“//example.xyz/vol02/xxxx-xxx/xxx.jpg” onload=“xxxt(-1)” class=“aligncenter” src=“https://i0.wp.com/ci0.club/imgload.jpg” datasrc=“https://example.club/images275/xxxx-xxx/xxx.jpg” alt=“マンガ作品タイト ル名- 【第55話】-MangaXXXX.com"></figure> © J-Stream Inc. All Rights Reserved. 6
7 議論ポイント • 被害を軽減するために技術的にできる方策はあるか? • 身元確認は不要か? らばどの程度か? サービスにより違いはあるか? 必要な • ドメイン以外のサイト識別子として何が考えられるか? • 事業者にとって違法サイトと見分け・判断が簡単な技術要素を 実現できないか? • 技術的に運営者の特定はできないのか? • 法律等の専門家や漫画家などの著作権者と技術者はどのように 連携していくべきか
キャッシュヒット率向上と転送量分割の工夫 CDN分散の参考資料 ▶P.6の工夫の図解 ◼誘導するCDN(契約)を分けることによる、キャッシュ容量の拡大 ◼転送量の分割 全クラスタに全URLを誘導する場合に比べ て、キャッシュ容量を3倍にできる 転送量を1/3に分散できる アクセスURLリスト(ルール) CDN A URL-A : CDN A File A:URL A https://urla.example.jp/image.png CDN B URL-B : CDN B File B:URL B https://urlb.example.jp/image.png URL-C : CDN C File C:URL C https://urlc.example.jp/image.png オリジン サーバ CDN C フロントエンド CDN © J-Stream Inc. All Rights Reserved. 8