マークアップ言語

HTML は Hyper Text Markup Language の頭文字をとったものです。後半の ML の部分は「マークアップ言語」です。

「マークアップ」は出版で長く使われきた「marking up」という用語に由来します。これは出版原稿の余白などに、どんな書体や文字サイズを使うのかなどの印刷方法の指示を書き込む作業です。この印刷指示自体は、印刷されないわけです。

このように、「表示される文字そのもの」と「(文字による)表示や構造に関する指示」が混在した状態で記述する形式のものを「マークアップ言語」と呼びます。「表示や構造に関する指示」が「表示される文字そのもの」と明確に区別できるように文法(文字の使い方)が決められます。

HTML では半角の「<」と「>」に囲まれた文字列は「タグ」とされ、そのものは表示されず、「指示」と解釈されます。たとえば「<h1>」「<main>」などです。半角の「<」と「>」それ自体を表示させたいときは、特別な書き方をします。

このように「マークアップ言語」である HTML で記述された文書は、すべてが「文字のみ」で記述されているので「テキストファイル」で保存できます。

しかし「マークアップ言語」で記述された文書そのものの見た目は、最終的な表示の「見た目」とは異なります。みなさんが普段使っている最近の「ワープロソフト」などはほぼすべて「(ほぼ)印刷されるとおりに表示される」すなわち WYSIWYG (What You See Is What You Get) であるために、最終的なできばえを画面ですぐに確認できます。しかしマークアップ言語は、それをいったん表示用のソフトウェアに処理させてからでないと、最終的なできばえを目で確認することはできません。HTML の場合は HTML ファイルをブラウザに読み込ませて表示させることが、これにあたります。

これはその昔、コンピュータの能力が低かったころ、印刷されるとおりにグラフィック表示させることはとても大変で時間がかかったために、細かい編集のたびに画面を描き直していては、時間ばかりかかって非効率だったことに由来します。「文字」だけのマークアップ言語で素早く記述し、一段落したところで時間をかけて表示画面を作り確認する、という手順が効率的だったのです。

現在はコンピュータの能力も飛躍的に向上し、印刷される通りにグラフィック表示することは苦もなくできるようになりました。そのため WYSIWYG 方式のワープロソフトが普及しています。それでもまだ「マークアップ言語」である HTML が、滅びずに生き残っているどころか、むしろ XML などの汎用記述形式も派生して大いに隆盛しているのは、上述の「文字のみ」の記述の軽量性・汎用性と、文字表現のもつ「抽象的な構造表現能力」によるところが大きいと考えられます。