


Bagaimanakah Saya Boleh Mengoptimumkan Transformasi Teoritik Nombor (NTT) dan Aritmetik Modular Saya untuk Pekuduaan Nombor Besar yang Lebih Pantas?
Dec 30, 2024 am 05:20 AMAritmetik modular dan pengoptimuman NTT (medan terhingga DFT)
Soalan asal:
I mahu menggunakan NTT untuk kuasa dua pantas (lihat pengiraan kuasa dua besar Bignum Cepat), tetapi hasilnya perlahan walaupun untuk nombor yang sangat besar .. lebih daripada 12000 bit.
Soalan saya ialah:
- Adakah terdapat cara untuk mengoptimumkan transformasi NTT saya?
Saya tidak bermaksud untuk mempercepatkannya dengan selari (benang); ini adalah lapisan peringkat rendah sahaja. - Adakah terdapat cara untuk mempercepatkan aritmetik modular saya?
Kod:
//--------------------------------------------------------------------------- class fourier_NTT // Number theoretic transform { public: DWORD r,L,p,N; DWORD W,iW,rN; fourier_NTT(){ r=0; L=0; p=0; W=0; iW=0; rN=0; } // main interface void NTT(DWORD *dst,DWORD *src,DWORD n=0); // DWORD dst[n] = fast NTT(DWORD src[n]) void iNTT(DWORD *dst,DWORD *src,DWORD n=0); // DWORD dst[n] = fast INTT(DWORD src[n]) // Helper functions bool init(DWORD n); // init r,L,p,W,iW,rN void NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w); // DWORD dst[n] = fast NTT(DWORD src[n]) // Only for testing void NTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w); // DWORD dst[n] = slow NTT(DWORD src[n]) void iNTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w); // DWORD dst[n] = slow INTT(DWORD src[n]) // DWORD arithmetics DWORD shl(DWORD a); DWORD shr(DWORD a); // Modular arithmetics DWORD mod(DWORD a); DWORD modadd(DWORD a,DWORD b); DWORD modsub(DWORD a,DWORD b); DWORD modmul(DWORD a,DWORD b); DWORD modpow(DWORD a,DWORD b); }; //--------------------------------------------------------------------------- void fourier_NTT:: NTT(DWORD *dst,DWORD *src,DWORD n) { if (n>0) init(n); NTT_fast(dst,src,N,W); // NTT_slow(dst,src,N,W); } //--------------------------------------------------------------------------- void fourier_NTT::INTT(DWORD *dst,DWORD *src,DWORD n) { if (n>0) init(n); NTT_fast(dst,src,N,iW); for (DWORD i=0;i<N;i++) dst[i]=modmul(dst[i],rN); // INTT_slow(dst,src,N,W); } //--------------------------------------------------------------------------- bool fourier_NTT::init(DWORD n) { // (max(src[])^2)*n < p else NTT overflow can ocur !!! r=2; p=0xC0000001; if ((n<2)||(n>0x10000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x30000000/n; // 32:30 bit best for unsigned 32 bit // r=2; p=0x78000001; if ((n<2)||(n>0x04000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x3c000000/n; // 31:27 bit best for signed 32 bit // r=2; p=0x00010001; if ((n<2)||(n>0x00000020)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x00000020/n; // 17:16 bit best for 16 bit // r=2; p=0x0a000001; if ((n<2)||(n>0x01000000)) { r=0; L=0; p=0; W=0; iW=0; rN=0; N=0; return false; } L=0x01000000/n; // 28:25 bit N=n; // size of vectors [DWORDs] W=modpow(r, L); // Wn for NTT iW=modpow(r,p-1-L); // Wn for INTT rN=modpow(n,p-2 ); // scale for INTT return true; } //--------------------------------------------------------------------------- void fourier_NTT:: NTT_fast(DWORD *dst,DWORD *src,DWORD n,DWORD w) { if (n<=1) { if (n==1) dst[0]=src[0]; return; } DWORD i,j,a0,a1,n2=n>>1,w2=modmul(w,w); // reorder even,odd for (i=0,j=0;i<n2;i++,j+=2) dst[i]=src[j]; for ( j=1;i<n ;i++,j+=2) dst[i]=src[j]; // recursion NTT_fast(src ,dst ,n2,w2); // even NTT_fast(src+n2,dst+n2,n2,w2); // odd // restore results for (w2=1,i=0,j=n2;i<n2;i++,j++,w2=modmul(w2,w)) { a0=src[i]; a1=modmul(src[j],w2); dst[i]=modadd(a0,a1); dst[j]=modsub(a0,a1); } } //--------------------------------------------------------------------------- void fourier_NTT:: NTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w) { DWORD i,j,wj,wi,a; for (wj=1,j=0;j<n;j++) { a=0; for (wi=1,i=0;i<n;i++) { a=modadd(a,modmul(wi,src[i])); wi=modmul(wi,wj); } dst[j]=a; wj=modmul(wj,w); } } //--------------------------------------------------------------------------- void fourier_NTT::INTT_slow(DWORD *dst,DWORD *src,DWORD n,DWORD w) { DWORD i,j,wi=1,wj=1,a; for (wj=1,j=0;j<n;j++) { a=0; for (wi=1,i=0;i<n;i++) { a=modadd(a,modmul(wi,src[i])); wi=modmul(wi,wj); } dst[j]=modmul(a,rN); wj=modmul(wj,iW); } } //--------------------------------------------------------------------------- DWORD fourier_NTT::shl(DWORD a) { return (a<<1)&0xFFFFFFFE; } DWORD fourier_NTT::shr(DWORD a) { return (a>>1)&0x7FFFFFFF; } //--------------------------------------------------------------------------- DWORD fourier_NTT::mod(DWORD a) { DWORD bb;
Atas ialah kandungan terperinci Bagaimanakah Saya Boleh Mengoptimumkan Transformasi Teoritik Nombor (NTT) dan Aritmetik Modular Saya untuk Pekuduaan Nombor Besar yang Lebih Pantas?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undress AI Tool
Gambar buka pakaian secara percuma

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

STD :: Chrono digunakan dalam C untuk memproses masa, termasuk mendapatkan masa semasa, mengukur masa pelaksanaan, titik masa operasi dan tempoh, dan masa analisis pemformatan. 1. Gunakan std :: chrono :: system_clock :: sekarang () untuk mendapatkan masa semasa, yang boleh ditukar menjadi rentetan yang boleh dibaca, tetapi jam sistem mungkin tidak membosankan; 2. Gunakan std :: chrono :: steady_clock untuk mengukur masa pelaksanaan untuk memastikan monoton, dan mengubahnya menjadi milisaat, saat dan unit lain melalui duration_cast; 3. Titik masa (time_point) dan tempoh (tempoh) boleh saling beroperasi, tetapi perhatian harus dibayar kepada keserasian unit dan zaman jam (Epoch)

Terdapat terutamanya kaedah berikut untuk mendapatkan jejak timbunan dalam C: 1. Gunakan fungsi backtrace dan backtrace_symbols pada platform Linux. Dengan memasukkan maklumat simbol panggilan dan percetakan, parameter -rdynamic perlu ditambah semasa menyusun; 2. Gunakan fungsi CaptureStackBackTrace pada platform Windows, dan anda perlu menghubungkan dbghelp.lib dan bergantung pada fail PDB untuk menghuraikan nama fungsi; 3. Gunakan perpustakaan pihak ketiga seperti GoogleBreakPad atau Boost.StackTrace untuk merentas platform dan memudahkan operasi menangkap stack; 4. Dalam Pengendalian Pengecualian, menggabungkan kaedah di atas untuk mengeluarkan maklumat timbunan secara automatik di blok tangkapan

Dalam C, jenis POD (Plainolddata) merujuk kepada jenis dengan struktur mudah dan serasi dengan pemprosesan data bahasa C. Ia perlu memenuhi dua syarat: ia mempunyai semantik salinan biasa, yang boleh disalin oleh memcpy; Ia mempunyai susun atur standard dan struktur memori boleh diramal. Keperluan khusus termasuk: Semua ahli bukan statik adalah awam, tiada pembina atau pemusnah yang ditentukan oleh pengguna, tiada fungsi maya atau kelas asas, dan semua ahli yang tidak statik sendiri adalah pod. Contohnya structpoint {intx; inty;} adalah pod. Kegunaannya termasuk I/O binari, Ceroperabilitas C, Pengoptimuman Prestasi, dan lain -lain. Anda boleh menyemak sama ada jenisnya adalah pod melalui std :: is_pod, tetapi disyorkan untuk menggunakan std :: is_trivia selepas c 11.

Untuk memanggil kod Python di C, anda mesti terlebih dahulu memulakan penterjemah, dan kemudian anda boleh mencapai interaksi dengan melaksanakan rentetan, fail, atau memanggil fungsi tertentu. 1. Inisialisasi penterjemah dengan py_initialize () dan tutupnya dengan py_finalize (); 2. Jalankan kod rentetan atau pyrun_simplefile dengan pyrun_simplefile; 3. Modul import melalui pyimport_importmodule, dapatkan fungsi melalui pyobject_getattrstring, bina parameter py_buildvalue, panggil fungsi dan proses kembali

Di C, terdapat tiga cara utama untuk lulus fungsi sebagai parameter: menggunakan penunjuk fungsi, std :: fungsi dan ekspresi lambda, dan generik templat. 1. Penunjuk fungsi adalah kaedah yang paling asas, sesuai untuk senario mudah atau antara muka C yang serasi, tetapi kebolehbacaan yang lemah; 2. STD :: Fungsi yang digabungkan dengan ekspresi lambda adalah kaedah yang disyorkan dalam moden C, menyokong pelbagai objek yang boleh dipanggil dan jenis selamat; 3. Kaedah generik templat adalah yang paling fleksibel, sesuai untuk kod perpustakaan atau logik umum, tetapi boleh meningkatkan masa penyusunan dan jumlah kod. Lambdas yang menangkap konteks mesti diluluskan melalui fungsi STD :: atau templat dan tidak boleh ditukar terus ke dalam penunjuk fungsi.

Anullpointerinc isaspecialvalueindicatingthatapointerdoesnotpointoanyanyvalidmemorylocation, anditisusedtosafelymanageandcheckpointersbeforedereferencing.1.beforec 11,0ornullwasused,

STD :: MOVE tidak benar -benar memindahkan apa -apa, ia hanya menukarkan objek ke rujukan RValue, memberitahu pengkompil bahawa objek itu boleh digunakan untuk operasi bergerak. Sebagai contoh, apabila tugasan rentetan, jika kelas menyokong semantik bergerak, objek sasaran boleh mengambil alih sumber objek sumber tanpa menyalin. Harus digunakan dalam senario di mana sumber perlu dipindahkan dan sensitif prestasi, seperti mengembalikan objek tempatan, memasukkan bekas, atau bertukar pemilikan. Walau bagaimanapun, ia tidak boleh disalahgunakan, kerana ia akan merosot ke dalam satu salinan tanpa struktur bergerak, dan status objek asal tidak ditentukan selepas pergerakan. Penggunaan yang sesuai apabila lulus atau mengembalikan objek boleh mengelakkan salinan yang tidak perlu, tetapi jika fungsi mengembalikan pembolehubah tempatan, pengoptimuman RVO mungkin sudah berlaku, sambil menambah STD :: MOVE boleh menjejaskan pengoptimuman. Terdedah kepada kesilapan termasuk penyalahgunaan objek yang masih perlu digunakan, pergerakan yang tidak perlu, dan jenis yang tidak boleh dimanfaatkan

Kunci kepada kelas abstrak ialah ia mengandungi sekurang -kurangnya satu fungsi maya murni. Apabila fungsi maya murni diisytiharkan di dalam kelas (seperti VirtualVoidDosomething () = 0;), kelas menjadi kelas abstrak dan tidak dapat secara langsung meniru objek, tetapi polimorfisme dapat direalisasikan melalui petunjuk atau rujukan; Jika kelas yang diperoleh tidak melaksanakan semua fungsi maya murni, ia juga akan kekal sebagai kelas abstrak. Kelas -kelas abstrak sering digunakan untuk menentukan antara muka atau tingkah laku bersama, seperti merancang kelas bentuk dalam melukis aplikasi dan melaksanakan kaedah cabutan () oleh kelas yang diperolehi seperti bulatan dan segi empat tepat. Senario yang menggunakan kelas abstrak termasuk: merancang kelas asas yang tidak boleh diterapkan secara langsung, memaksa pelbagai kelas berkaitan untuk mengikuti antara muka bersatu, menyediakan tingkah laku lalai, dan memerlukan subclass untuk menambah butiran. Di samping itu, c
