Wie lese und schreibe ich nicht-UTF-8-codierte Textdateien in Go?
Dec 04, 2024 pm 08:40 PMLesen und Schreiben von Nicht-UTF-8-Textdateien in Go
Hintergrund
Von Standardm??ig geht die Standardbibliothek in Go davon aus, dass Textdateien in UTF-8 codiert sind. Es gibt jedoch Situationen, in denen Sie auf Textdateien sto?en, die in unterschiedlichen Kodierungen codiert sind, z. B. GBK.
L?sung
Zum Lesen und Schreiben von Nicht-UTF-8-Textdateien In Go k?nnen Sie die folgenden Schritte ausführen:
Nicht-UTF-8 lesen Dateien
-
Importieren Sie das erforderliche Paket: import "golang.org/x/text/encoding/simplifiedchinese"
Dieses Paket stellt GB18030, GBK und HZ bereit -GB2312-Kodierungsimplementierungen. -
Erstellen Sie eine io.Reader mit transform.NewReader:
f, err := os.Open(filename) if err != nil { log.Fatal(err) } r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder())
Nicht-UTF-8-Dateien schreiben
- Dasselbe Paket importieren:importieren "golang.org/x/text/encoding/simplifiedchinese"
-
Erstellen Sie einen io.Writer mit transform.NewWriter:
f, err := os.Create(filename) if err != nil { log.Fatal(err) } w := transform.NewWriter(f, simplifiedchinese.GBK.NewEncoder())
Beispiel
Das folgende Beispiel zeigt So lesen und schreiben Sie eine GBK-codierte Textdatei:
import ( "bufio" "fmt" "log" "os" "golang.org/x/text/encoding/simplifiedchinese" "golang.org/x/text/transform" ) func main() { const filename = "example_GBK_file" exampleWriteGBK(filename) exampleReadGBK(filename) } func exampleReadGBK(filename string) { f, err := os.Open(filename) if err != nil { log.Fatal(err) } r := transform.NewReader(f, simplifiedchinese.GBK.NewDecoder()) sc := bufio.NewScanner(r) for sc.Scan() { fmt.Printf("Read line: %s\n", sc.Bytes()) } if err := sc.Err(); err != nil { log.Fatal(err) } if err := f.Close(); err != nil { log.Fatal(err) } } func exampleWriteGBK(filename string) { f, err := os.Create(filename) if err != nil { log.Fatal(err) } w := transform.NewWriter(f, simplifiedchinese.GBK.NewEncoder()) // Write some text from the Wikipedia GBK page that includes Chinese _, err = fmt.Fprintln(w, `In 1995, China National Information Technology Standardization Technical Committee set down the Chinese Internal Code Specification (Chinese: 漢字內(nèi)碼擴展規(guī)范(GBK); pinyin: Hànzì Nèimǎ Kuòzhǎn Guīfàn (GBK)), Version 1.0, known as GBK 1.0, which is a slight extension of Codepage 936. The newly added 95 characters were not found in GB 13000.1-1993, and were provisionally assigned Unicode PUA code points.`) if err != nil { log.Fatal(err) } if err := f.Close(); err != nil { log.Fatal(err) } }
Dieser Code ?ffnet eine GBK-codierte Textdatei, liest ihren Inhalt und schreibt ihn in eine andere GBK-codierte Textdatei.
Das obige ist der detaillierte Inhalt vonWie lese und schreibe ich nicht-UTF-8-codierte Textdateien in Go?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen

GO kompiliert das Programm standardm??ig in eine eigenst?ndige Bin?rdatei. Der Hauptgrund ist die statische Verknüpfung. 1. Einfacher Bereitstellung: Keine zus?tzliche Installation von Abh?ngigkeitsbibliotheken kann direkt über Linux -Verteilungen ausgeführt werden. 2. Gr??ere bin?re Gr??e: einschlie?lich aller Abh?ngigkeiten führt zu einer Erh?hung der Dateigr??e, kann jedoch durch Erstellen von Flags oder Komprimierungswerkzeugen optimiert werden. 3.. H?here Vorhersagbarkeit und Sicherheit: Vermeiden Sie Risiken, die durch ?nderungen der externen Bibliotheksversionen verursacht werden und die Stabilit?t verbessern; 4. Flexibilit?t begrenzter Betrieb: Kann nicht hei?es Update der gemeinsam genutzten Bibliotheken sowie eine Neukompilien und Bereitstellung erforderlich sind, um Abh?ngigkeitsf?lligkeiten zu beheben. Diese Funktionen sind für CLI-Tools, Microservices und andere Szenarien geeignet. In Umgebungen, in denen die Speicherung eingeschr?nkt ist oder auf zentrales Management beruht, sind Kompromisse erforderlich.

Um einen Pufferkanal in GO zu erstellen, geben Sie einfach die Kapazit?tsparameter in der Funktion machen. Mit dem Pufferkanal kann der Sendungsvorgang Daten vorübergehend speichern, wenn kein Empf?nger vorliegt, solange die angegebene Kapazit?t nicht überschritten wird. Zum Beispiel erstellt CH: = make (Chanint, 10) einen Pufferkanal, der bis zu 10 Ganzzahlwerte speichern kann. Im Gegensatz zu ungelandten Kan?len werden die Daten beim Senden nicht sofort blockiert, aber die Daten werden vorübergehend im Puffer gespeichert, bis sie vom Empf?nger weggenommen werden. Beachten Sie bitte: 1. Die Kapazit?tseinstellung sollte angemessen sein, um Speicherabf?lle oder h?ufiges Blockieren zu vermeiden. 2. Der Puffer muss verhindern, dass Speicherprobleme im Puffer auf unbestimmte Zeit angesammelt werden. 3. Das Signal kann vom Chanstruct {} -Typ übergeben werden, um Ressourcen zu sparen; Zu den h?ufigen Szenarien geh?rt die Kontrolle der Anzahl der Parallelit?t, Herstellerverbrauchermodelle und Differenzierung

GOENSURSMEMORYSFETTYWITHOUTMANUALMANUMAGETROUGHAUTOMATICGARBAGECOLLECTION, Nopointerarithmetic, SafeConcurrency, Andruntimechecks.First, Go’sgarbageboceColectorAutomaticReclaimsUnusedMemory, Verhinderung von Verhinderung der Verhinderung von Verhinderung der

GO ist ideal für die Systemprogrammierung, da es die Leistung von kompilierten Sprachen wie C mit der Benutzerfreundlichkeit und Sicherheit moderner Sprachen kombiniert. 1. In Bezug auf Datei- und Verzeichnisoperationen unterstützt das Betriebssystempaket von Go unterstützt die Erstellung, L?schung, Umbenennung und überprüfung, ob Dateien und Verzeichnisse vorhanden sind. Verwenden Sie OS.ReadFile, um die gesamte Datei in einer Codezeile zu lesen, die zum Schreiben von Sicherungsskripten oder Protokollierungstools geeignet ist. 2. In Bezug auf die Prozessverwaltung kann die Funktion von Exec.Command des OS/EXEC -Pakets externe Befehle ausführen, die Ausgabe erfassen, Umgebungsvariablen festlegen, Eingangs- und Ausgangsflüsse umleiten und die Lebensdauer von Prozesslebenszyklen für Automatisierungstools und Bereitstellungsskripte geeignet sind. 3. In Bezug auf Netzwerk und Parallelit?t unterstützt das NET -Paket TCP/UDP -Programmierung, DNS -Abfrage und Originals?tze.

In der GO -Sprache muss eine Strukturmethode aufgerufen werden, muss zun?chst die Struktur und die Methode definieren, die den Empf?nger bindet, und auf sie zugreift mit einer Punktzahl. Nach der Definition des Strukturrechtecks ??kann die Methode über den Wertempf?nger oder den Zeigerempf?nger deklariert werden. 1. Verwenden Sie den Wertempf?nger wie Func (rrectangle) aa () int und rufen Sie ihn direkt über rect.Area () an; 2. Wenn Sie die Struktur ?ndern müssen, verwenden Sie den Zeigerempf?nger wie Func (R*Rechteck) Setwidth (...) und behandelt automatisch die Umwandlung von Zeigern und Werten. 3. Bei der Einbettung der Struktur wird die Methode der eingebetteten Struktur verbessert und kann direkt durch die ?u?ere Struktur aufgerufen werden. 4..

In Go ist eine Schnittstelle ein Typ, der Verhalten ohne Angabe der Implementierung definiert. Eine Schnittstelle besteht aus Methodensignaturen und jedem Typ, der diese Methoden implementiert, die die Schnittstelle automatisch erfüllt. Wenn Sie beispielsweise eine Lautsprecherschnittstelle definieren, die die Speak () -Methode enth?lt, k?nnen alle Typen, die die Methode implementieren, als Sprecher betrachtet werden. Schnittstellen eignen sich zum Schreiben gemeinsamer Funktionen, Abstrakt -Implementierungsdetails und Verwendung von Scheinobjekten im Testen. Das Definieren einer Schnittstelle verwendet das Schlüsselwort der Schnittstelle und listet Methodensignaturen auf, ohne den Typ ausdrücklich zu deklarieren, um die Schnittstelle zu implementieren. Gemeinsame Anwendungsf?lle umfassen Protokolle, Formatierung, Abstraktionen verschiedener Datenbanken oder Dienste sowie Benachrichtigungssysteme. Zum Beispiel k?nnen sowohl Hund- als auch Robotertypen Sprechmethoden implementieren und an dieselbe Anno weitergeben

In der GO-Sprache werden String-Operationen haupts?chlich über Strings-Pakete und integrierte Funktionen implementiert. 1.Strings.Contains () wird verwendet, um festzustellen, ob eine Zeichenfolge einen Substring enth?lt, und gibt einen booleschen Wert zurück. 2.Strings.index () kann den Ort finden, an dem das Substring zum ersten Mal erscheint und wenn es nicht existiert, gibt es -1 zurück. 3.Strings.ReplaceAll () kann alle übereinstimmenden Substrings ersetzen und auch die Anzahl der Ersetzungen durch Zeichenfolgen steuern. Replace (); 4.Len () Funktion wird verwendet, um die L?nge der Bytes der Zeichenfolge zu erhalten. Bei der Verarbeitung von Unicode müssen Sie jedoch auf den Unterschied zwischen Zeichen und Bytes achten. Diese Funktionen werden h?ufig in Szenarien wie Datenfilterung, Textanalyse und String -Verarbeitung verwendet.

TheGoiopackageProviDEnterFaCesLikeraderAndWritertOhandlei/ooperationsgerafigAcrossSources.1.io.
