国产av日韩一区二区三区精品,成人性爱视频在线观看,国产,欧美,日韩,一区,www.成色av久久成人,2222eeee成人天堂

首頁(yè) 後端開發(fā) Golang Go 的 UTF 支援:一個(gè)有趣的限制

Go 的 UTF 支援:一個(gè)有趣的限制

Nov 09, 2024 am 12:09 AM

Go

我最近一直在探索 Go 的 UTF-8 支持,並且很好奇它在程式碼中處理非拉丁腳本的效果如何。

使用 UTF-8

Go 原始檔預(yù)設(shè)採(cǎi)用 UTF-8 編碼。這意味著理論上您可以在變數(shù)名稱、函數(shù)名稱等中使用 Unicode 字元。

例如,在官方的 Go Playground 樣板程式碼中,你可能會(huì)遇到這樣的程式碼:

package main

import "fmt"

func main() {
    消息 := "Hello, World!"
    fmt.Println(消息)
}

這裡的「訊息」是中文「訊息」的意思。由於其 Unicode 支持,Go 可以毫無問題地處理這個(gè)問題。這種功能是 Go 在中國(guó)和日本等國(guó)家流行的原因之一——開發(fā)人員可以使用對(duì)自己語(yǔ)言有意義的識(shí)別碼來編寫程式碼。你可能不會(huì)相信,但用母語(yǔ)編寫程式碼在中國(guó)非常受歡迎,我喜歡它。


嘗試使用泰米爾語(yǔ)識(shí)別碼

當(dāng)然,我想用我的母語(yǔ)泰米爾語(yǔ)試試看。

這是我寫的一個(gè)簡(jiǎn)單範(fàn)例:

package main

import "fmt"

func main() {
    ????????? := 42 // "?????????" means "number"
    fmt.Println("Value:", ?????????)
}

乍一看,這似乎很簡(jiǎn)單,可以運(yùn)行而不會(huì)出現(xiàn)任何錯(cuò)誤。

但是,當(dāng)我嘗試編譯程式碼時(shí),我遇到了錯(cuò)誤

./prog.go:6:11: invalid character U+0BCD '?' in identifier
./prog.go:6:17: invalid character U+0BBF '?' in identifier
./prog.go:6:23: invalid character U+0BCD '?' in identifier
./prog.go:6:29: invalid character U+0BC8 '?' in identifier
./prog.go:7:33: invalid character U+0BCD '?' in identifier
./prog.go:7:39: invalid character U+0BBF '?' in identifier
./prog.go:7:45: invalid character U+0BCD '?' in identifier
./prog.go:7:51: invalid character U+0BC8 '?' in identifier

了解泰米爾語(yǔ)組合標(biāo)記的問題

要了解正在發(fā)生的事情,有必要了解一些泰米爾語(yǔ)腳本的工作原理。

泰米爾語(yǔ)是一種abugida——一種將每個(gè)輔音-元音序列寫成一個(gè)單元的書寫系統(tǒng)。在 Unicode 中,這通常涉及將基本輔音字元與表示元音或其他修飾符的一個(gè)或多個(gè)組合標(biāo)記組合起來。

例如:

  • 泰米爾語(yǔ)字母? (U 0B95) 代表子音「ka」

  • 要表示“ki”,您可以將 ? 與元音符號(hào) ? (U 0BBF) 組合起來,得到 ??。

  • 元音符號(hào) ? 是一個(gè)組合標(biāo)記,在 Unicode 中被明確歸類為「非空格標(biāo)記」。

這就是問題出現(xiàn)的地方。

Go 的語(yǔ)言規(guī)範(fàn)允許在識(shí)別符中使用 Unicode 字母,但排除組合標(biāo)記。具體來說,識(shí)別碼可以包含分類為「字母」的字元(類別 Lu、Ll、Lt、Lm、Lo 或 Nl)和數(shù)字,但不能包含組合標(biāo)記(類別 Mn、Mc、Me)。


泰米爾語(yǔ)組合標(biāo)記範(fàn)例

讓我們看看泰米爾語(yǔ)字符是如何形成的:

  • 獨(dú)立輔音:? (U 0B95) - Go 識(shí)別碼中允許使用。

  • 子音元音符號(hào):?? (U 0B95 U 0BBE) - 不允許,因?yàn)? (U 0BBE) 是組合標(biāo)記 (Mc)。

  • 輔音元音符號(hào):?? (U 0B95 U 0BBF) - 不允許,因?yàn)? (U 0BBF) 是組合標(biāo)記 (Mn)。

  • 子音元音符號(hào):?? (U 0B95 U 0BC2) - 不允許,因?yàn)? (U 0BC2) 是組合標(biāo)記 (Mc)。

標(biāo)識(shí)符?????????(「數(shù)字」)中,字元包含組合標(biāo)記:

  • ? (U 0B8E) - 信,允許。

  • ?? (U 0BA3 U 0BCD) - 由? (U 0BA3) 和 virama ? (U 0BCD) 組成,組合標(biāo)記 (Mn)。

  • ? (U 0BA3) - 信,允許。

  • ????? - 包含組合標(biāo)記,如 ? (U 0BBF) 和 ? (U 0BC8)。

由於 Go 標(biāo)識(shí)符中不允許使用這些組合標(biāo)記,因此編譯器在遇到它們時(shí)會(huì)拋出錯(cuò)誤。


為什麼漢字可以用而泰米爾語(yǔ)不行

漢字在 Unicode 中通常被歸類為「字母、其他」(Lo) 類別。它們是獨(dú)立的符號(hào),不需要組合標(biāo)記來形成完整的字元。這就是為什麼像訊息這樣的標(biāo)識(shí)符在 Go 中完美運(yùn)作的原因。

實(shí)際意義

無法在識(shí)別符中使用組合標(biāo)記對(duì)於泰米爾語(yǔ)等腳本具有重大影響:

  • 表達(dá)能力有限:如果不組合標(biāo)記,幾乎不可能用泰米爾語(yǔ)寫有意義的識(shí)別字。

  • 教育障礙:使用本機(jī)腳本可以使學(xué)習(xí)編碼變得更容易,但這些限制阻礙了這種可能性,特別是對(duì)於遵循基於 abugida 的書寫系統(tǒng)的語(yǔ)言。

  • 包容性挑戰(zhàn):雖然 Go 的目標(biāo)是透過 UTF-8 支援實(shí)現(xiàn)包容性,但組合標(biāo)記的限制排除了許多依賴它們的語(yǔ)言。

總結(jié)

Go 的 UTF-8 支援是朝著使程式設(shè)計(jì)更具包容性邁出的一大步。然而,在標(biāo)識(shí)符中排除組合標(biāo)記對(duì)泰米爾語(yǔ)、印地語(yǔ)和阿拉伯語(yǔ)等語(yǔ)言造成了障礙,在這些語(yǔ)言中,組合標(biāo)記是腳本的組成部分。

作為一名來自泰米爾納德邦、主要從事 Go 工作的開發(fā)人員,這個(gè)發(fā)現(xiàn)既令人興奮又有點(diǎn)令人失望。它強(qiáng)調(diào)了程式語(yǔ)言真正國(guó)際化的複雜性。

誰(shuí)用母語(yǔ)編碼來建立軟體產(chǎn)品! ? ! ! ! !

絕對(duì)!與東亞地區(qū)不同,那裡不遵循基於“abugida”的書寫系統(tǒng)。

而且,顯然,Go 的創(chuàng)建者一開始就不會(huì)打算將 UTF-8 合規(guī)性用於「本地語(yǔ)言編碼」。原因更多是為了提供更好的 ASCII 處理、與現(xiàn)代 Web 標(biāo)準(zhǔn)保持一致、一致的字串處理以及邁向互通性的一步。

這次嘗試只是我的好奇心,想了解我們能在 Go 中實(shí)現(xiàn) UTF-8 合規(guī)性到什麼程度。作為一個(gè)致力於用 Go 建立可擴(kuò)展的分散式金融科技系統(tǒng)的人,我發(fā)現(xiàn)了解這些細(xì)微差別至關(guān)重要。


就是這樣。感謝您的閱讀。

快樂編碼:)願(yuàn)程式碼與你同在。

以上是Go 的 UTF 支援:一個(gè)有趣的限制的詳細(xì)內(nèi)容。更多資訊請(qǐng)關(guān)注PHP中文網(wǎng)其他相關(guān)文章!

本網(wǎng)站聲明
本文內(nèi)容由網(wǎng)友自願(yuàn)投稿,版權(quán)歸原作者所有。本站不承擔(dān)相應(yīng)的法律責(zé)任。如發(fā)現(xiàn)涉嫌抄襲或侵權(quán)的內(nèi)容,請(qǐng)聯(lián)絡(luò)admin@php.cn

熱AI工具

Undress AI Tool

Undress AI Tool

免費(fèi)脫衣圖片

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅(qū)動(dòng)的應(yīng)用程序,用於創(chuàng)建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費(fèi)的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費(fèi)的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強(qiáng)大的PHP整合開發(fā)環(huán)境

Dreamweaver CS6

Dreamweaver CS6

視覺化網(wǎng)頁(yè)開發(fā)工具

SublimeText3 Mac版

SublimeText3 Mac版

神級(jí)程式碼編輯軟體(SublimeText3)

默認(rèn)情況下,GO靜態(tài)鏈接的含義是什麼? 默認(rèn)情況下,GO靜態(tài)鏈接的含義是什麼? Jun 19, 2025 am 01:08 AM

Go默認(rèn)將程序編譯為獨(dú)立二進(jìn)製文件,主要原因是靜態(tài)鏈接。 1.部署更簡(jiǎn)單:無需額外安裝依賴庫(kù),可直接跨Linux發(fā)行版運(yùn)行;2.二進(jìn)制體積更大:包含所有依賴導(dǎo)致文件尺寸增加,但可通過構(gòu)建標(biāo)誌或壓縮工具優(yōu)化;3.更高的可預(yù)測(cè)性與安全性:避免外部庫(kù)版本變化帶來的風(fēng)險(xiǎn),增強(qiáng)穩(wěn)定性;4.運(yùn)行靈活性受限:無法熱更新共享庫(kù),需重新編譯部署以修復(fù)依賴漏洞。這些特性使Go適用於CLI工具、微服務(wù)等場(chǎng)景,但在存儲(chǔ)受限或依賴集中管理的環(huán)境中需權(quán)衡取捨。

在沒有C中的手動(dòng)內(nèi)存管理的情況下,如何確保內(nèi)存安全性? 在沒有C中的手動(dòng)內(nèi)存管理的情況下,如何確保內(nèi)存安全性? Jun 19, 2025 am 01:11 AM

Goensuresmemorysafetywithoutmanualmanagementthroughautomaticgarbagecollection,nopointerarithmetic,safeconcurrency,andruntimechecks.First,Go’sgarbagecollectorautomaticallyreclaimsunusedmemory,preventingleaksanddanglingpointers.Second,itdisallowspointe

如何在GO中創(chuàng)建緩衝頻道? (例如,make(chan int,10)) 如何在GO中創(chuàng)建緩衝頻道? (例如,make(chan int,10)) Jun 20, 2025 am 01:07 AM

在Go中創(chuàng)建緩衝通道只需在make函數(shù)中指定容量參數(shù)即可。緩衝通道允許發(fā)送操作在沒有接收者時(shí)暫存數(shù)據(jù),只要未超過指定容量,例如ch:=make(chanint,10)創(chuàng)建了一個(gè)可存儲(chǔ)最多10個(gè)整型值的緩衝通道;與無緩衝通道不同,發(fā)送數(shù)據(jù)時(shí)不會(huì)立即阻塞,而是將數(shù)據(jù)暫存於緩衝區(qū)中,直到被接收者取走;使用時(shí)需注意:1.容量設(shè)置應(yīng)合理以避免內(nèi)存浪費(fèi)或頻繁阻塞;2.需防止緩衝區(qū)無限堆積數(shù)據(jù)導(dǎo)致內(nèi)存問題;3.可用chanstruct{}類型傳遞信號(hào)以節(jié)省資源;常見場(chǎng)景包括控制並發(fā)數(shù)量、生產(chǎn)者-消費(fèi)者模型及異

如何使用GO進(jìn)行系統(tǒng)編程任務(wù)? 如何使用GO進(jìn)行系統(tǒng)編程任務(wù)? Jun 19, 2025 am 01:10 AM

Go是系統(tǒng)編程的理想選擇,因?yàn)樗Y(jié)合了C等編譯型語(yǔ)言的性能與現(xiàn)代語(yǔ)言的易用性和安全性。 1.文件與目錄操作方面,Go的os包支持創(chuàng)建、刪除、重命名及檢查文件和目錄是否存在,使用os.ReadFile可一行代碼讀取整個(gè)文件,適用於編寫備份腳本或日誌處理工具;2.進(jìn)程管理方面,通過os/exec包的exec.Command函數(shù)可執(zhí)行外部命令、捕獲輸出、設(shè)置環(huán)境變量、重定向輸入輸出流以及控制進(jìn)程生命週期,適合用於自動(dòng)化工具和部署腳本;3.網(wǎng)絡(luò)與並發(fā)方面,net包支持TCP/UDP編程、DNS查詢及原始套

如何在GO中的結(jié)構(gòu)實(shí)例上調(diào)用方法? 如何在GO中的結(jié)構(gòu)實(shí)例上調(diào)用方法? Jun 24, 2025 pm 03:17 PM

在Go語(yǔ)言中,調(diào)用結(jié)構(gòu)體方法需先定義結(jié)構(gòu)體和綁定接收者的方法,使用點(diǎn)號(hào)訪問。定義結(jié)構(gòu)體Rectangle後,可通過值接收者或指針接收者聲明方法;1.使用值接收者如func(rRectangle)Area()int,通過rect.Area()直接調(diào)用;2.若需修改結(jié)構(gòu)體,應(yīng)使用指針接收者如func(r*Rectangle)SetWidth(...),Go會(huì)自動(dòng)處理指針與值的轉(zhuǎn)換;3.嵌入結(jié)構(gòu)體時(shí),內(nèi)嵌結(jié)構(gòu)體的方法會(huì)被提升,可直接通過外層結(jié)構(gòu)體調(diào)用;4.Go無需強(qiáng)制使用getter/setter,字

GO中的接口是什麼?如何定義它們? GO中的接口是什麼?如何定義它們? Jun 22, 2025 pm 03:41 PM

在Go語(yǔ)言中,接口是一種定義行為而不指定實(shí)現(xiàn)方式的類型。接口由方法簽名組成,任何實(shí)現(xiàn)這些方法的類型都自動(dòng)滿足該接口。例如,定義一個(gè)Speaker接口包含Speak()方法,則所有實(shí)現(xiàn)該方法的類型均可視為Speaker。接口適用於編寫通用函數(shù)、抽象實(shí)現(xiàn)細(xì)節(jié)和測(cè)試中使用mock對(duì)象。定義接口使用interface關(guān)鍵字並列出方法簽名,無需顯式聲明類型實(shí)現(xiàn)了接口。常見用例包括日誌、格式化、不同數(shù)據(jù)庫(kù)或服務(wù)的抽象,以及通知系統(tǒng)等。例如,Dog和Robot類型均可實(shí)現(xiàn)Speak方法,並傳遞給同一個(gè)Anno

如何在GO中使用字符串軟件包中的字符串函數(shù)? (例如len(),strings.contains(),strings.index(),strings.replaceall()) 如何在GO中使用字符串軟件包中的字符串函數(shù)? (例如len(),strings.contains(),strings.index(),strings.replaceall()) Jun 20, 2025 am 01:06 AM

在Go語(yǔ)言中,字符串操作主要通過strings包和內(nèi)置函數(shù)實(shí)現(xiàn)。 1.strings.Contains()用於判斷字符串是否包含子串,返回布爾值;2.strings.Index()可查找子串首次出現(xiàn)的位置,若不存在則返回-1;3.strings.ReplaceAll()能替換所有匹配的子串,還可通過strings.Replace()控制替換次數(shù);4.len()函數(shù)用於獲取字符串字節(jié)數(shù)長(zhǎng)度,但處理Unicode時(shí)需注意字符與字節(jié)的區(qū)別。這些功能常用於數(shù)據(jù)過濾、文本解析及字符串處理等場(chǎng)景。

如何使用IO軟件包在GO中使用輸入和輸出流? 如何使用IO軟件包在GO中使用輸入和輸出流? Jun 20, 2025 am 11:25 AM

TheGoiopackageprovidesinterfaceslikeReaderandWritertohandleI/Ooperationsuniformlyacrosssources.1.io.Reader'sReadmethodenablesreadingfromvarioussourcessuchasfilesorHTTPresponses.2.io.Writer'sWritemethodfacilitateswritingtodestinationslikestandardoutpu

See all articles