Wrong HTML - Tidyでよく使いそうなオプション

HTML, XHTML, XML Options

Clean : Boolean

Default - False

視覚的な要素と属性をスタイルへと変換するかどうか。MS-Officeで保存したHTMLでよく働くそうです(笑)

DocType : auto | omit | strict | loose | transitional | user specified fpi (string)

Default - auto

Tidyが出力するHTML文書の文書型設定。omitにするとDOCTYPEは省かれます。fpiはXHTMLの時に設定するとシステム識別子に空の文字列を入れてしまうようです。

drop-empty-paras : Boolean

Default - True

空の段落P要素の破棄。Falseにセットした場合は空の段落を削除し、一組のBR要素に置きかえられる。

drop-font-tags : Boolean

Default - False

CleanオプションがTrueの時のようにスタイルへするよりも、Font、Centerを破棄するかどうかの指定。

drop-proprietary-attributes : Boolean

Default - False

MS data binding属性などの属性を取り除くかどうか

enclose-text : Boolean

Default - False

Body内で見つけたすべてのテキストをP要素で囲むかどうか

logical-emphasis : Boolean

Default - False

I要素をEM要素に、B要素をSTRONG要素へと置換する。この場合属性はそのまま使用される。また、Clean、drop-font-tagsの指定がどうあってもこのオプションを指定できる。

lower-literals : Boolean

Default - True

小文字で定義されている属性値を小文字へと変換するかどうか。XHTMLでは必要。

ncr : Boolean

Default - True

数値による参照を許可するかどうか。

output-xhtml : Boolean

Default - False

XHTMLとして出力するかどうか。文書はきちんとXHTML化されて出力される。また、オリジナルの要素、属性はそのまま使用される。

xml-output : Boolean

Default - False

XMLとして出力するかどうか。XML1.0で定義されていない実体は数値参照へ置換、オリジナルの要素、属性はそのまま使用される。

repeated-attributes : keep-first | keep-last

Default - keep-last

属性が繰り返された場合に最初と最後のどちらの属性を維持するか。

replace-color : Boolean

Default - False

数値として指定された色をその名前に置換するかどうか。(例:#000000 → black)

word-2000 : Boolean

Default - False

MS Word 2000で保存したドキュメントから余分なものを取り除く。埋め込まれたイメージかVML(ベクトルマークアップ言語)は扱わない。

Pretty Print Options

markup : Boolean

Default - True

Tidyがきれいにしたドキュメントを出力しないようにする。著しいエラーを発見した場合はそれほどきれいなドキュメントを出力しないことに注意してください。

wrap : Integer

Default - 68

Tidyが出力するドキュメントの折り返し文字数を指定する。折り返さないようにするには0に設定する。

Character Encoding Options

char-encoding : ascii | latin1 | raw | utf8 | iso2022 |mac |win1252 | utf16 | utf16le | utf16be | big5 | shiftjis

Default - ascii

入出力の文字コードの指定。

input-encoding : ascii | latin1 | raw | utf8 | iso2022 |mac |win1252 | utf16 | utf16le | utf16be | big5 | shiftjis

入力するドキュメントの文字コード指定。

Default - latin1

output-encoding : ascii | latin1 | raw | utf8 | iso2022 |mac |win1252 | utf16 | utf16le | utf16be | big5 | shiftjis

Default - ascii

出力されるドキュメントの文字コード指定。

newline : LF | CRLF | CR

Default - プラットフォーム依存

改行コードの指定。

Miscellaneous Options

output-file : String

Default - なし

Tidyが出力するドキュメントを保存するファイルの指定。

error-file : String

Default - なし

エラーを保存するファイルの指定。

write-back : Boolean

Default - False

Tidyが出力するドキュメントで元のファイルを書き換える。重要なファイルのコピーをとることをおすすめします。

accessibility-check : 0 | 1 | 2 | 3

Default - 0

WAIのガイドラインに従ったアクセシビリティのチェックができます。設定値は0はチェックなし、1が優先度1、2は優先度1と2、3が1,2,3全てのチェックとなっています。

よく使いそうなオプションだけを挙げてみましたが、Tidyのオプションはこれだけではありません。色々と試してみてくださいね。