


Bagaimana untuk Membaca dan Menulis Fail Teks Bukan UTF-8 Dikodkan dalam Go?
Dec 04, 2024 pm 08:40 PMMembaca dan Menulis Fail Teks Bukan UTF-8 dalam Go
Latar Belakang
Oleh lalai, perpustakaan standard dalam Go menganggap bahawa fail teks dikodkan dalam UTF-8. Walau bagaimanapun, terdapat senario di mana anda mungkin menghadapi fail teks yang dikodkan dalam pengekodan berbeza, seperti GBK.
Penyelesaian
Untuk membaca dan menulis fail teks bukan UTF-8 dalam Go, anda boleh menggunakan langkah berikut:
Membaca Bukan UTF-8 Fail
-
Import pakej yang diperlukan: import "golang.org/x/text/encoding/simplifiedchinese"
Pakej ini menyediakan GB18030, GBK dan HZ -GB2312 pelaksanaan pengekodan. -
Buat an io.Reader menggunakan transform.NewReader:
f, err := os.Open(filename) if err != nil { log.Fatal(err) } r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder())
Menulis Fail Bukan UTF-8
- Import pakej yang sama: import "golang.org/x/text/encoding/simplifiedchinese"
-
Buat io.Writer menggunakan transform.NewWriter:
f, err := os.Create(filename) if err != nil { log.Fatal(err) } w := transform.NewWriter(f, simplifiedchinese.GBK.NewEncoder())
Contoh
Contoh berikut menunjukkan cara untuk baca dan tulis fail teks berkod GBK:
import ( "bufio" "fmt" "log" "os" "golang.org/x/text/encoding/simplifiedchinese" "golang.org/x/text/transform" ) func main() { const filename = "example_GBK_file" exampleWriteGBK(filename) exampleReadGBK(filename) } func exampleReadGBK(filename string) { f, err := os.Open(filename) if err != nil { log.Fatal(err) } r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder()) sc := bufio.NewScanner(r) for sc.Scan() { fmt.Printf("Read line: %s\n", sc.Bytes()) } if err := sc.Err(); err != nil { log.Fatal(err) } if err := f.Close(); err != nil { log.Fatal(err) } } func exampleWriteGBK(filename string) { f, err := os.Create(filename) if err != nil { log.Fatal(err) } w := transform.NewWriter(f, simplifiedchinese.GBK.NewEncoder()) // Write some text from the Wikipedia GBK page that includes Chinese _, err = fmt.Fprintln(w, `In 1995, China National Information Technology Standardization Technical Committee set down the Chinese Internal Code Specification (Chinese: 漢字內(nèi)碼擴展規(guī)范(GBK); pinyin: Hànzì Nèimǎ Kuòzhǎn Guīfàn (GBK)), Version 1.0, known as GBK 1.0, which is a slight extension of Codepage 936. The newly added 95 characters were not found in GB 13000.1-1993, and were provisionally assigned Unicode PUA code points.`) if err != nil { log.Fatal(err) } if err := f.Close(); err != nil { log.Fatal(err) } }
Kod ini membuka fail teks berkod GBK, membaca kandungannya dan menulisnya ke fail teks berkod GBK yang lain.
Atas ialah kandungan terperinci Bagaimana untuk Membaca dan Menulis Fail Teks Bukan UTF-8 Dikodkan dalam Go?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Pergi menyusun program ke dalam binari mandiri secara lalai, sebab utama adalah menghubungkan statik. 1. Penyebaran yang lebih mudah: Tiada pemasangan tambahan perpustakaan ketergantungan, boleh dijalankan secara langsung di seluruh pengagihan Linux; 2. Saiz binari yang lebih besar: termasuk semua kebergantungan menyebabkan saiz fail meningkat, tetapi boleh dioptimumkan melalui bendera bangunan atau alat pemampatan; 3. Predikabiliti dan keselamatan yang lebih tinggi: Elakkan risiko yang dibawa oleh perubahan dalam versi perpustakaan luaran dan meningkatkan kestabilan; 4. Fleksibiliti operasi terhad: Tidak boleh kemas kini panas perpustakaan yang dikongsi, dan penyusunan semula dan penggunaan diperlukan untuk memperbaiki kelemahan ketergantungan. Ciri-ciri ini sesuai untuk alat CLI, microservices dan senario lain, tetapi perdagangan diperlukan dalam persekitaran di mana penyimpanan dihadkan atau bergantung kepada pengurusan berpusat.

Untuk membuat saluran penampan di Go, hanya tentukan parameter kapasiti dalam fungsi membuat. Saluran Buffer membolehkan operasi penghantaran untuk menyimpan data sementara apabila tiada penerima, selagi kapasiti yang ditentukan tidak melebihi. Sebagai contoh, Ch: = Make (Chanint, 10) mencipta saluran penampan yang boleh menyimpan sehingga 10 nilai integer; Tidak seperti saluran yang tidak dibuang, data tidak akan disekat dengan segera apabila menghantar, tetapi data akan disimpan sementara dalam penampan sehingga ia diambil oleh penerima; Apabila menggunakannya, sila ambil perhatian: 1. Tetapan kapasiti harus munasabah untuk mengelakkan sisa memori atau penyekatan kerap; 2. Penimbal perlu mencegah masalah ingatan daripada terkumpul selama -lamanya dalam penampan; 3. Isyarat boleh diluluskan oleh jenis Chanstruct {} untuk menjimatkan sumber; Senario biasa termasuk mengawal bilangan konkurensi, model pengguna dan pembezaan

Goensuresmemorysafetywithoutmanualmanagementthroughautomaticgarbagecollection,nopointerarithmetic,safeconcurrency,andruntimechecks.First,Go’sgarbagecollectorautomaticallyreclaimsunusedmemory,preventingleaksanddanglingpointers.Second,itdisallowspointe

GO sangat sesuai untuk pengaturcaraan sistem kerana ia menggabungkan prestasi bahasa yang disusun seperti C dengan kemudahan penggunaan dan keselamatan bahasa moden. 1. Dari segi operasi fail dan direktori, pakej OS Go menyokong penciptaan, penghapusan, penamaan semula dan memeriksa sama ada fail dan direktori wujud. Gunakan OS.READFILE untuk membaca keseluruhan fail dalam satu baris kod, yang sesuai untuk menulis skrip sandaran atau alat pemprosesan log; 2. Dari segi pengurusan proses, fungsi exec.command pakej OS/EXEC boleh melaksanakan arahan luaran, menangkap output, menetapkan pembolehubah persekitaran, aliran input dan output mengalihkan, dan kitaran hayat proses kawalan, yang sesuai untuk alat automasi dan skrip penempatan; 3. Dari segi rangkaian dan kesesuaian, pakej bersih menyokong pengaturcaraan TCP/UDP, pertanyaan DNS dan set asal.

Dalam bahasa Go, memanggil kaedah struktur memerlukan terlebih dahulu menentukan struktur dan kaedah yang mengikat penerima, dan mengaksesnya menggunakan nombor titik. Selepas menentukan segi empat tepat struktur, kaedah boleh diisytiharkan melalui penerima nilai atau penerima penunjuk; 1. Gunakan penerima nilai seperti kawasan func (rrectangle) int dan terus memanggilnya melalui rect.area (); 2. Jika anda perlu mengubah suai struktur, gunakan penerima penunjuk seperti func (R*segi empat) setWidth (...), dan GO akan secara automatik mengendalikan penukaran penunjuk dan nilai; 3. Apabila membenamkan struktur, kaedah struktur tertanam akan diperbaiki, dan ia boleh dipanggil secara langsung melalui struktur luar; 4. Pergi tidak perlu memaksa menggunakan getter/setter,

Di GO, antara muka adalah jenis yang mentakrifkan tingkah laku tanpa menentukan pelaksanaan. Antara muka terdiri daripada tandatangan kaedah, dan mana -mana jenis yang melaksanakan kaedah ini secara automatik memenuhi antara muka. Sebagai contoh, jika anda menentukan antara muka penceramah yang mengandungi kaedah bercakap (), semua jenis yang melaksanakan kaedah boleh dipertimbangkan pembesar suara. Antara muka sesuai untuk menulis fungsi umum, butiran pelaksanaan abstrak, dan menggunakan objek mengejek dalam ujian. Menentukan antara muka menggunakan kata kunci antara muka dan menyenaraikan tandatangan kaedah, tanpa secara jelas mengisytiharkan jenis untuk melaksanakan antara muka. Kes penggunaan biasa termasuk log, pemformatan, abstraksi pangkalan data atau perkhidmatan yang berbeza, dan sistem pemberitahuan. Sebagai contoh, kedua -dua jenis anjing dan robot boleh melaksanakan kaedah bercakap dan menyampaikannya kepada anno yang sama

Dalam bahasa Go, operasi rentetan terutamanya dilaksanakan melalui pakej rentetan dan fungsi terbina dalam. 1.Strings.Contains () digunakan untuk menentukan sama ada rentetan mengandungi substring dan mengembalikan nilai boolean; 2.Strings.index () boleh mencari lokasi di mana substring muncul untuk kali pertama, dan jika ia tidak wujud, ia kembali -1; 3.Strings.ReplaceAll () boleh menggantikan semua substrings yang sepadan, dan juga boleh mengawal bilangan pengganti melalui string.replace (); 4. Len () Fungsi digunakan untuk mendapatkan panjang bait rentetan, tetapi apabila memproses Unicode, anda perlu memberi perhatian kepada perbezaan antara aksara dan bait. Fungsi ini sering digunakan dalam senario seperti penapisan data, parsing teks, dan pemprosesan rentetan.

TheGoioPackageProvidesInderFacesLikeReaderAndWritertohandlei/ooperatiationUniformlyAsssources.1.io.Reader'sReadmethodenablesreadingingfromvarioussourcessuchasfilesorhtpresponses.2.WriterSwriteShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileShacileS.
