Appendix B : “やさしい”HTML

 インターネットは世界に開かれた共有のネットワークである。それを取り巻く環境は千差万別,自分の環境を中心に考えるのではいけない。WWW で情報発信を試みるとき,どんな配慮をすればよいのだろうか。

代替テキスト

 <IMG> には ALT 属性を指定しなくてはならない。これはノングラフィカルな UA やスピーチデバイスを配慮したものである。

 この ALT 属性には“絵の説明”のように述べてきた。実際,絵を説明するようなテキストでじゅうぶん絵の代替になりうるのだが,つねに説明であることが適切だとは限らない。

 ALT 属性をうまく書くコツは,“この絵を文字に置き換えるとどのようになるか”を考えることである。たしかに,文字で表せないから絵を使うというのもあるのだが,可能な限り適切なものを考えるようにしたい。その結果,ALT 属性を空(ALT="")としたり(かといって属性自体を省略するのはいけない)する場合も生じてくるだろう。

 ALT 属性に無意味な文字列を指定しておくのはご法度である。とりわけスピーチデバイスなどでは,無意味・無関係な言葉が読み上げられたりしていい迷惑である。

外部ファイルへの参照

 WWW では,今やさまざまなファイル,とりわけ画像,音声,ときには動画ファイルが多く飛び交うようになったが,こういったファイルは HTML ファイルに比べると格段にサイズが大きい。

 あるページに 50Kbyte 程度の画像が 10 枚貼り込まれていたとしたら,それだけで 500Kbyte,読み込みにけっこうな時間がかかるのは目に見えている。ページを作成するときは,ローカルで作業するから回線などを気にすることがなく,このようなことを行ってしまいがちである。

 これを回避するために,画像一覧が表示されるページから,大きなファイルサイズの画像があるページを <A> を使って呼ぶということを行うとよい。カタログのページはサイズを小さくしたり,減色を施したり,JPEG では圧縮率を高くしたりするという処理を行ってファイルサイズを小さくし,多くの画像があるページを速く読めるように工夫しておく。

 もし,リンク先の画像や音声ファイル,動画ファイルのサイズがかなり大きいものである場合,そのサイズを明示しておくのもよい。それで相手側がそのファイルを読むかどうかの判断材料になる。これは,何も画像などのファイルに限った話ではない。

 外部のファイルが <OBJECT> を用いて貼り込まれている場合,そのファイルが巨大な動画ファイルであっても読みにいくことがある。それがストリーム再生できるものならともかく,読み終わってはい再生,ではもし処理できないファイルだったときは悲惨である。

 そんなときのために,TYPE 属性を指定できるときは指定するとよい。また,Windows 環境ではファイルの“拡張子”を見る場合もあるので,ファイルには適切な拡張子をつけておくようにしたい。

文書情報

 まずは,ファイルの文字コードセットを <META> を使って書くことに心がけたい。とくに,日本語の文書においては,シフト JIS と EUC が誤認されるときがあるので,この場合は必ず指定しておくようにしよう。

 サーチエンジンに対しての情報も与えておくとよい。サーチエンジンによっては,ファイルサイズが小さい文書の場合,文書中のあらゆる単語でもってヒットしてしまうことがある。どうでもいい単語でヒットするのも不本意だろうし,重要なキーワードでヒットしないとなおさらであろう。

 この状況は,サーチエンジンの適合順位付けアルゴリズムの改善によって少なくなってきた。また,これを逆手にとって,ページの内容とは無関係な単語で,利用者が検索に使用しそうな単語を大量に書き込むことで,“客寄せ”を行う“スパム行為”もあったが,これもサーチエンジンのアルゴリズム改善によって排除されつつある。

 ロボットを用いたサーチエンジンの側も,文書中に指定された情報を検索において重視するような姿勢がとられることが望まれる。現在(98 年 10 月),この <META> の情報をよく反映してくれるロボット型のサーチエンジンには,InfoseekODIN などがある。

多くの UA で閲覧できる文書を

 一般に,UA は,HTML の文法に多少反していても,それなりの出力がなされるようにできている。その寛容さが HTML の普及を助けたといえるが,逆に粗悪な HTML が WWW に多く現れた原因でもある。

 しかし,UA はそれぞれ“どこまで寛容か”というのが違うのであって,正しくない HTML に対する出力は,本来保証されない。したがって,正しく HTML を書くことは,すべての人にあまねく情報を提供するためにも大変重要なことなのである。であるから,試してみて“こうなった”からそれで公開,という姿勢は好ましいとはいえない。

 また,本稿では扱わないが,UA 独自の記述の問題もあろう。それを使用するのは自由かもしれないが,情報を見に来た人の自由は奪うべきではない。あくまで慎重に,それを使うことによって“読めない”サイトにしないように注意するべきである。

 正しく HTML を書いていても,UA の不備によって認識されない記述がある。これには UA をつくった側の責任も多分にあるが,それも簡単なものだったらフォローしておくようにしたい。

 よく知られているものとしては,

などがある。

 もうひとつの問題は,たとえば HTML 4.0 で書かれた文書を HTML 3.2 まで対応の UA で閲覧した場合の HTML 4.0 相当分の記述である。これが再現されない分にはあるいは致し方ないかもしれないが,ときには出力が大きく乱れることがある。

といったケースもあることを気にとめておいていただきたい。