Hukum Zipf adalah hukum empiris, yang diformulasikan menggunakan statistik matematika, dinamai sesuai dengan nama ahli bahasa George Kingsley Zipf, yang pertama kali mengusulkannya.

Hukum Zipf menyatakan bahwa jika diberikan sampel besar kata yang digunakan, frekuensi kata apa pun berbanding terbalik dengan peringkatnya dalam tabel frekuensi. Jadi kata nomor n memiliki frekuensi yang sebanding dengan 1/n.

Dengan demikian, kata yang paling sering muncul akan muncul sekitar dua kali lebih sering daripada kata kedua yang paling sering muncul, tiga kali lebih sering daripada kata ketiga yang paling sering muncul, dll. Misalnya, dalam satu sampel kata dalam bahasa Inggris, kata yang paling sering muncul, "the", menyumbang hampir 7% dari semua kata (69.971 dari sedikit lebih dari 1 juta). Sesuai dengan Hukum Zipf, kata "of" di tempat kedua menyumbang sedikit lebih dari 3,5% kata (36.411 kemunculan), diikuti oleh "and" (28.852). Hanya sekitar 135 kata yang diperlukan untuk menjelaskan setengah dari sampel kata dalam sampel yang besar.

Hubungan yang sama terjadi dalam banyak peringkat lainnya, yang tidak terkait dengan bahasa, seperti peringkat populasi kota di berbagai negara, ukuran perusahaan, peringkat pendapatan, dll. Munculnya distribusi dalam peringkat kota berdasarkan populasi pertama kali diperhatikan oleh Felix Auerbach pada tahun 1913.

Tidak diketahui mengapa hukum Zipf berlaku untuk sebagian besar bahasa.