Prawo Zipfa stanowi, że częstość występowania danego słowa w tekście jest w przybliżeniu odwrotnie proporcjonalna do jego rangi (ranga słowa to jego numer na liście słów porządkowanej od najczęstszych do najrzadszych, najczęstsze słowo ma rangę 1, drugie najczęstsze słowo ma rangę 2, itd.). Wykres ten rysuje się w skali log-log, bo wtedy taka
zależność jest linią prostą, ze współczynnikiem kierunkowym -1. Narysowana na wykresie Zipfa prosta (szara) ma współczynnik -0.97, a więc prawo jest dobrze spełnione.
Plik udostępniony dzięki uprzejmości Tomasza Stanisza - Instytut Fizyki Jądrowej PAN
Osoby, które współpracowały przy tworzeniu tego utworu przeniosły go do domeny publicznej poprzez zrezygnowanie ze wszystkich przysługujących im praw na obszarze całego świata z tytułu prawa autorskiego oraz wszystkich powiązanych i podobnych praw, w zakresie dopuszczalnym przez prawo. Możesz kopiować, zmieniać, rozprowadzać i wykonywać to dzieło, nawet wykorzystując do celów komercyjnych bez pytania o pozwolenie.
http://creativecommons.org/publicdomain/zero/1.0/deed.enCC0Creative Commons Zero, Public Domain Dedicationfalsefalse
Podpisy
Plik został zamieszczony jako wynik pracy dzięki Wikigrantowi Stowarzyszenia Wikimedia Polska https://pl.wikimedia.org/wiki/WG_2019-11