


Wie kann ich meine zahlentheoretische Transformation (NTT) und meine modulare Arithmetik für die schnelle Quadrierung sehr gro?er Zahlen optimieren?
Dec 18, 2024 pm 04:56 PMModulare Arithmetik und NTT-Optimierungen (Finite Field DFT)
Problem: Ich wollte verwenden NTT für schnelles Quadrieren (siehe Schnelle Bignum-Quadratberechnung), aber das Ergebnis ist selbst für wirklich gro?e Zahlen langsam. mehr als 12000 Bits.
Meine Frage lautet also:
- Gibt es eine M?glichkeit, meine zu optimieren? NTT-Transformation?
Ich wollte es nicht durch Parallelit?t (Threads) beschleunigen; Dies ist nur eine Low-Level-Ebene. - Gibt es eine M?glichkeit, meine modulare Arithmetik zu beschleunigen?
Dies ist mein (bereits optimierter) Quellcode in C für NTT (er ist vollst?ndig und funktioniert zu 100 % in C). ohne dass Bibliotheken von Drittanbietern erforderlich sind, und sollte au?erdem threadsicher sein. Beachten Sie, dass das Quellarray nur als tempor?res Array verwendet wird!!! Au?erdem kann es das Array nicht in sich selbst umwandeln.
//--------------------------------------------------------------------------- class fourier_NTT // Number theoretic transform { public: DWORD r,L,p,N; DWORD W,iW,rN; fourier_NTT(){ r=0; L=0; p=0; W=0; iW=0; rN=0; } // main interface void NTT(DWORD *dst,DWORD *src,DWORD n=0); // DWORD dst[n] = fast NTT(DWORD src[n]) void INTT(DWORD *dst,DWORD *src,DWORD n=0); // DWORD dst[n] = fast INTT(DWORD src[n]) // Helper functions bool init(DWORD n); // init r,L,p,W,iW,rN void NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w); // DWORD dst[n] = fast NTT(DWORD src[n]) // Only for testing void NTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w); // DWORD dst[n] = slow NTT(DWORD src[n]) void INTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w); // DWORD dst[n] = slow INTT(DWORD src[n]) // DWORD arithmetics DWORD shl(DWORD a); DWORD shr(DWORD a); // Modular arithmetics DWORD mod(DWORD a); DWORD modadd(DWORD a,DWORD b); DWORD modsub(DWORD a,DWORD b); DWORD modmul(DWORD a,DWORD b); DWORD modpow(DWORD a,DWORD b); }; //--------------------------------------------------------------------------- void fourier_NTT:: NTT(DWORD *dst,DWORD *src,DWORD n) { if (n>0) init(n); NTT_fast(dst,src,N,W); // NTT_slow(dst,src,N,W); } //--------------------------------------------------------------------------- void fourier_NTT::INTT(DWORD *dst,DWORD *src,DWORD n) { if (n>0) init(n); NTT_fast(dst,src,N,iW); for (DWORD i=0;i<N;i++) dst[i]=modmul(dst[i],rN); // INTT_slow(dst,src,N,W); } //--------------------------------------------------------------------------- bool fourier_NTT::init(DWORD n) { // (max(src[])^2)*n < p else NTT overflow can ocur !!! r=2; p=0xC0000001; if ((n<2)||(n>0x10000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x30000000/n; // 32:30 bit best for unsigned 32 bit // r=2; p=0x78000001; if ((n<2)||(n>0x04000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x3c000000/n; // 31:27 bit best for signed 32 bit // r=2; p=0x00010001; if ((n<2)||(n>0x00000020)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x00000020/n; // 17:16 bit best for 16 bit // r=2; p=0x0a000001; if ((n<2)||(n>0x01000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x01000000/n; // 28:25 bit N=n; // size of vectors [DWORDs] W=modpow(r, L); // Wn for NTT iW=modpow(r,p-1-L); // Wn for INTT rN=modpow(n,p-2 ); // scale for INTT return true; } //--------------------------------------------------------------------------- void fourier_NTT:: NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w) { if (n<=1) { if (n==1) dst[0]=src[0]; return; } DWORD i,j,a0,a1,n2=n>>1,w2=modmul(w,w); // reorder even,odd for (i=0,j=0;i<n2;i++,j+=2) dst[i]=src[j]; for ( j=1;i<n ;i++,j+=2) dst[i]=src[j]; // recursion NTT_fast(src ,dst ,n2,w2); // even NTT_fast(src+n2,dst+n2,n2,w2); // odd // restore results for (w2=1,i=0,j=n2;i<n2;i++,j++,w2=modmul(w2,w)) { a0=src[i]; a1=modmul(src[j],w2); dst[i]=modadd(a0,a1); dst[j]=modsub(a0,a1); } } //--------------------------------------------------------------------------- void fourier_NTT:: NTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w) { DWORD i,j,wj,wi,a,n2=n>>1; for (wj=1,j=0;j<n;j++) { a=0; for (wi=1,i=0;i<n;i++) { a=modadd(a,modmul(wi,src[i])); wi=modmul(wi,wj); } dst[j]=a; wj=modmul(wj,w); } } //--------------------------------------------------------------------------- void fourier_NTT::INTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w) { DWORD i,j,wi=1,wj=1,a,n2=n>>1; for (wj=1,j=0;j<n;j++) { a=0; for (wi=1,i=0;i<n;i++) { a=modadd(a,modmul(wi,src[i])); wi=modmul(wi,wj); } dst[j]=modmul(a,rN); wj=modmul(wj,iW); } } //---------------------------------------------------------------------------
Das obige ist der detaillierte Inhalt vonWie kann ich meine zahlentheoretische Transformation (NTT) und meine modulare Arithmetik für die schnelle Quadrierung sehr gro?er Zahlen optimieren?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Hei?e KI -Werkzeuge

Undress AI Tool
Ausziehbilder kostenlos

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem v?llig kostenlosen KI-Gesichtstausch-Tool aus!

Hei?er Artikel

Hei?e Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Hei?e Themen

Ja, die überlastung von Funktionen ist eine polymorphe Form in C, speziell kompiliert-Time-Polymorphismus. 1. Funktionsüberladung erm?glicht mehrere Funktionen mit demselben Namen, aber unterschiedlichen Parameterlisten. 2. Der Compiler entscheidet, welche Funktion zur Kompilierung der entsprechenden Parameter zu Kompilierzeit aufgerufen werden soll. 3. Im Gegensatz zum Laufzeitpolymorphismus hat Funktion überladung zur Laufzeit keinen zus?tzlichen Overhead und ist einfach zu implementieren, aber weniger flexibel.

C hat zwei polymorphe Haupttypen: Kompilierungszeitpolymorphismus und Laufzeitpolymorphismus. 1. Die Kompilierungszeitpolymorphismus wird durch Funktion überladung und Vorlagen implementiert, was eine hohe Effizienz bietet, kann jedoch zu Code-Bl?hungen führen. 2. Die Laufzeitpolymorphismus wird durch virtuelle Funktionen und Vererbung implementiert, die Flexibilit?t, aber Leistungsaufwand bietet.

Ja, Polymorphismen in C sind sehr nützlich. 1) Es bietet Flexibilit?t, um eine einfache Erg?nzung neuer Typen zu erm?glichen. 2) f?rdert die Wiederverwendung von Code und reduziert die Duplikation; 3) vereinfacht die Wartung und erleichtert den Code, sich zu erweitern und sich an ?nderungen anzupassen. Trotz der Herausforderungen des Leistungs- und Ged?chtnismanagements sind die Vorteile in komplexen Systemen besonders von Bedeutung.

C DestructorscanleadtoseveralcommonErrors.Toavoidthem: 1) PREVORDDoUbledelTionBysettingPointerstonullPtrorusingsMartPointers.2) Handlexzepionsindrute -byCatchingandLoggingThem.3) UseVirirtualDestructorsinbaseClaStroperPoperPolymorpicdestruction.4

Polymorphismen in C werden in Laufzeitpolymorphismen und Kompilierungs-Zeit-Polymorphismen unterteilt. 1. Die Laufzeit -Polymorphismus wird durch virtuelle Funktionen implementiert, sodass die richtige Methode zur Laufzeit dynamisch aufgerufen werden kann. 2. Die Kompilierungszeitpolymorphismus wird durch Funktionsüberlastung und Vorlagen implementiert, wodurch eine h?here Leistung und Flexibilit?t erzielt wird.

Menschen, die den Python -Transfer zu C studieren. Die direkteste Verwirrung ist: Warum k?nnen Sie nicht wie Python schreiben? Da C, obwohl die Syntax komplexer ist, zugrunde liegenden Kontrollfunktionen und Leistungsvorteile. 1. In Bezug auf die Syntaxstruktur verwendet C Curly -Klammern {} anstelle von Einrückungen, um Codebl?cke zu organisieren, und variable Typen müssen explizit deklariert werden; 2. In Bezug auf das Typensystem und die Speicherverwaltung verfügt C nicht über einen automatischen Mülleimermechanismus und muss den Speicher manuell verwalten und auf die Freigabe von Ressourcen achten. Die Raii -Technologie kann das Ressourcenmanagement unterstützen. 3. In Funktionen und Klassendefinitionen muss C explizit auf Modifikatoren, Konstrukteure und Zerst?rer zugreifen und erweiterte Funktionen wie die überlastung des Bedieners unterstützen. 4. In Bezug auf Standardbibliotheken bietet STL leistungsstarke Container und Algorithmen, muss sich jedoch an generische Programmierideen anpassen. 5

C Polymorphismincludes-Compile-Time, Laufzeit und TemplatePolymorphismus.1) Compile-TimepolymorphismusseFranction undoperatoroverloading Forefficiency.2) RunTimepolymorphismPirtualFunctionsforflexibilit?t.3) templatepolymorphisMenenericProgrammprogrammen

C polymorphismisuniqueduetoitsCombinationofcompile-Timeandruntimepolymorphismus, der Forbothefficiency-Flexibilit?t erlaubt
