HTML 基本チュートリアル コンピュータコーディング (文字セット)
コンピューターのエンコーディング (文字セット) - コンピューターはバイナリ データのみを処理できるため、
なぜ文字セットがあるのか??を理解します。コンピューターが人間の言語 (0 ~ 9、a ~ z、A ~ Z、特殊記號) を認識するには、各文字を「エンコード」する必要があります。いわゆる「エンコーディング」とは、各文字を異なるバイナリ システムで表現(xiàn)できることを意味します。
仮定: A は 2 進數(shù)で 1000 を表し、B は 2 進數(shù)で 1001 を表します。
ASCII エンコード: すべての文字を表すのに 1 バイト (8 ビット 2 進數(shù)) が使用され、合計 2^8 = 256 を表すことができます。
ANSI エンコーディング: 他の國では、自國の言語を表示するために ASCII エンコーディングを拡張しています。
ANSI (中國語のオペレーティング システムでは gb2312
ANSI)、従來のオペレーティング システムでは big5
ANSI、日本語のオペレーティング システムでは JIS
...
2 バイト (16 ビット バイナリ) を使用します (表現(xiàn)するには、合計 2^16 = 65536 文字を表現(xiàn)できます。
GB2312 には、合計 6763 の漢字が含まれます。
GBK エンコード: GB2312)一部の人気のない文字、珍しい文字、古代中國語などを拡張して収録
漢字を合計21,000文字収録
- 欠點: 1 つの文字を表すために 32 ビット バイナリを使用すると、スペースが膨大に消費されます。
- 前提條件: 1 000000000000000000000000000001 を表すには Unicode エンコーディングを使用します。
「國」を使用できます。