シェアする

トラフィックの最適化 (1995)

これは、1995年に書いたものです。

インターネットの利用形態は、あっというまに変化して、WWW 全盛期を迎えま した。インターネット上のトラフィックは、イメージを大量に含んだ画面の転 送が増え、うなぎのぼりです。かつて、インターネットのトラフィックは、 ftp-data が 40 % くらいを占めていました。量は相変わらず増え続けていま すが、内容は変わってきました。NSFNET の最後のトラフィックデータ (NSFNET は 1995 年 4 月末をもって消滅したので、これ以降のデー タはない)を見ても、ついに www が ftp を追い抜いています。

かつては、バックボーントラフィックを圧迫している 原因の多くは ftp であっ たため、これをなんとか軽減しようということで、よく使われるファイル、た とえば X window のソースや、GNU のアーカイブなどの、ftp サーバの内容を ミラーするということの調整が行われました。

INS64 による 64Kbps での接続も、機器の普及が進みつつあり、 個人のダイアルアップでも利用できるようになってきています。 T1 = 1.5 Mbps といったって、たかが 64Kbps x 24 にしかすぎません。仮に 45Mbps になったところで、このたった 30 倍ですから、ユーザが急激に増加 してきている今、もう一度考える必要があるでしょう。

国際回線を持っているネットワークでは、海外のアーカイブのミラーを、日本 の入口で一度行い、そして更にそこから、国内の主要なサーバへミラーすると いう順で行いました。国際回線を持っている組織の間で調 整をして、手分けをして貴重な回線をできるだけ合理的に使おうとするもので す。

IIJ でも、サービス開始当初から ftp.iij.ad.jp を mirror サーバとして稼 働させました。その内容は、どんどん増え続け、現在は約 50 GB にもなろう としています。当初の目的は海外でまとまったアーカイブを作っているところ について、可能な場合は複製を作り、国内の利用者の便宜を図ろうという目的 です。もっとも海外からも ftp.iij.ad.jp をアクセスされることもだんだん 増えてきたので、後には、日本の情報も集めておく必要がでて来ました。

このように、anonymous ftp で得られるリソースに関しては、ミラーリングが 相当進んでいます。ですから、目指すものが、オリジナルは海外であっても、 できるだけ国内、できれば自分のつながっているネットワークにできるだけ近 いところを探すとよいでしょう。

商用プロバイダに接続している場合では ftp.iij.ad.jp や、ftp.web.ad.jp, ftp.tokyonet.ad.jp, ftp.nec.co.jp, ftp.meshnet.or.jp, ftp.nisiq.net な どを利用するとよいでしょう。大学等の場合には、上記の他、 ftp.kuis.kyoto-u.ac.jp, ftp.cc.keio.ac.jp, ftp.center.osaka-u.ac.jp, ftp.riken.go.jp などがよく整備されているサーバとして、便利でしょう。

ftp で公開されているファイルを検索するには archie というシステムがあり ます。全世界のデータを保持している archie サーバが、archie.iij.ad.jp です。日本国内だけの情報を持っているサーバが、archie.wide.ad.jp, archie.kuis.kyoto-u.ac.jp で運用されています。

どこが近いかどうかというのは、UNIX なら traceroute というコマンドを利 用することで分かります。近いところから取ってくることは、なによりす早く 持ってくることができますから、時間の節約になります。従量制のダイアルアッ プ IP 接続の場合には重要でしょう。

さて、では WWW の場合にはどうすればいいのでしょう。WWW の場合、ミラー サーバという考え方はあまりありません。また、anonymous ftp の場合に比べ て、1 つの情報の単位が小さく、より分散しています。しかし、人気のある情 報へのアクセスが集中することは起こっています。現在の HTTP の仕組みでは、 URL のホストの情報が含まれるという形態になっているため、ミラーを取ると いうことがやりにくくなっていることも確かです。

そこで、キャッシュサーバという考え方が出てきました。キャッシュサーバと は、ネットワークの途中に設置して、一度取ってきたものは、保存しておいて 次の同じリクエストには元へとりに行かないで、保存してあるものを要求した クライアントに渡すというものです。proxy server として実装されます。proxy server はもともとはファイアウォールの内側の直接のインターネットへの接続性 を制限されたクライアントから WWW サーバへアクセスするためのテクニック ですが、この応用としてキャッシュサーバが実現しています。実装は、CERN httpd と、Netscape 社の製品の proxy server があります。

IIJ では、dialup IP ユーザのために、proxy.iijnet.or.jp を設置していま す。これは現在のところ CERN httpd による proxy server が稼働していて、 cache を行っています。ダイアルアップ IP ユーザは Netscape navigator な どの proxy の設定を proxy.iijnet.or.jp の 8080 にすることで、キャッシュ の利用ができて、キャッシュにヒットすれば、より高速に情報を得ることがで きます。

専用線接続を行っている組織でもできるだけ、各組織ごとにキャッシュをして、 できるだけ合理的に利用をすることが望ましいでしょう。これだけでもかなり 効率よく WWW トラフィックを減らすことができます。

WIDE プロジェクトでは、WWW キャッシュを合理的かつ効率よく行うためには どうすればいいかという話題も出て、具体的な研究に着手しようとしています。