![](https://assets.iflscience.com/assets/articleNo/76965/aImg/80512/zipfs-law-m.png)
มนุษย์คาดเดาได้มากกว่าที่เราคิดไว้มากไหม?
เครดิตรูปภาพ: lassedesignen/shutterstock.com
มนุษย์ชอบคิดว่าเราเป็นสิ่งมีชีวิตที่ไม่อาจคาดเดาได้ ในระดับหนึ่ง ถูกควบคุมโดยเจตจำนงเสรีที่โผล่ออกมาจากกระบวนการทางกายภาพ นี่เป็นเรื่องแปลกอย่างหนึ่งที่ส่งคุณเข้าสู่วิกฤตการดำรงอยู่บนพื้นฐานของภาษาศาสตร์ ภาษาส่วนใหญ่ดูเหมือนจะเป็นไปตามสมการที่เรียกว่ากฎของ Zipf และเราไม่รู้ว่าทำไม
มีการใช้คำที่มีความถี่ต่างกันตามที่คุณคาดหวัง คุณใช้คำว่า "the" มากกว่าที่คุณใช้กับคำว่า "ecumenical" หรือ "" เป็นต้น แต่การวิเคราะห์ความถี่ของการใช้คำในข้อความขนาดใหญ่พบว่าเป็นไปตามกฎทางสถิติเฉพาะอย่างใกล้ชิด
"ประมาณ 80 ปีที่แล้ว George Kingsley Zipf รายงานข้อสังเกตว่าความถี่ของคำดูเหมือนจะเป็นฟังก์ชันกฎกำลังของอันดับความถี่ของคำ ซึ่งกำหนดเป็น f(r) ∝ 𝑟𝛼, ที่ไหนฉคือความถี่ของคำรคืออันดับของความถี่ และ 𝛼 คือเลขชี้กำลัง"กระดาษในหัวข้อจะอธิบาย
พูดง่ายๆ ก็คือ คำที่ใช้บ่อยที่สุดในภาษาหนึ่งๆ ในภาษาอังกฤษ "the" ถูกใช้บ่อยเป็นสองเท่าของคำที่พบบ่อยลำดับถัดไป และบ่อยกว่าคำถัดไปสามเท่า และบ่อยกว่าคำถัดไปสี่เท่า และปฏิบัติตามกฎแห่งอำนาจนี้มาเป็นเวลานานอย่างน่าประหลาดใจ
คุณอาจคิดว่านี่เป็นมุมแหลมแปลกๆ ของภาษาอังกฤษ แต่ก็ไม่ใช่ กฎหมายของ Zipf ดูเหมือนจะนำไปใช้กับเกือบทุกภาษาที่ถูกพิจารณา ไม่ว่าคุณจะพูดภาษาอังกฤษ ฮินดี ฝรั่งเศส จีนกลาง หรือสเปน ความถี่ของคำดูเหมือนจะลดลงตามอันดับความนิยม
![](https://assets.iflscience.com/assets/articleNo/76965/iImg/80506/zipf.png)
กฎของ Zipf ใช้กับ 10 ล้านคำแรกใน 30 ภาษาที่แตกต่างกันบนวิกิพีเดีย
ที่แปลกกว่านั้นคือมันยังใช้ได้กับภาษาด้วยซ้ำเรายังไม่ได้ถอดรหัสเลยแม้กระทั่งคำที่ปรากฏในดูเหมือนจะปฏิบัติตามกฎหมายนี้- และข้อความแต่ละฉบับหากมีขนาดใหญ่พอ ก็จะเป็นไปตามกฎเหล่านี้โดยประมาณเช่นกัน โดยคำที่มีอันดับสูงสุดปรากฏมากกว่าคำถัดไปสองเท่า เป็นต้น เป็นต้น แม้แต่ Charles Darwin ก็ไม่สามารถพัฒนาแนวทางของเขาออกจากคำนี้ด้วยคำเดียว การวิเคราะห์พบว่ามันนำไปใช้กับข้อความของเขาได้ค่อนข้างเรียบร้อยว่าด้วยเรื่องต้นกำเนิดของสายพันธุ์- จริง ๆ แล้วมันก็ปลูกทั่วทุกแห่ง
มันค่อนข้างแปลกใช่ไหม?
"การไตร่ตรองถึงลักษณะเฉพาะของกฎหมายนี้ควรค่าแก่การพิจารณา" การทบทวนหัวข้ออธิบาย- “แน่นอนว่ามันเป็นคุณสมบัติที่ไม่ซับซ้อนของภาษามนุษย์ที่คำต่างๆ มีความถี่ต่างกันไป มันอาจจะสมเหตุสมผลที่จะคาดหวังว่าคำทุกคำควรจะมีความถี่เท่ากัน แต่เนื่องจากคำนั้นมีความถี่ต่างกันไป จึงไม่ชัดเจนว่าเหตุใดคำจึงควรตามหลัง เป็นกฎทางคณิตศาสตร์ที่แม่นยำ โดยเฉพาะอย่างยิ่งกฎที่ไม่ได้อ้างอิงถึงแง่มุมใดๆ ของความหมายของคำแต่ละคำ"
มีคำอธิบายที่เป็นไปได้มากมายสำหรับแนวคิดนี้ ตั้งแต่ปัญหาทางสถิติไปจนถึงข้อจำกัดที่เกิดจากความจำและคำศัพท์ของมนุษย์ จอร์จ ซิปฟ์ เองเสนอว่ากฎหมายมาจากความสมดุลของความพยายามในการลดความพยายาม โดยผู้พูด (หรือนักเขียน) พยายามลดความพยายามของตนเองโดยใช้คำที่เกิดขึ้นบ่อยมากขึ้น และผู้ฟัง (หรือผู้อ่าน) แสวงหาความชัดเจนในภาษาจากคำที่ใช้ไม่บ่อย . ส่วนขยายของสิ่งนี้คือ มนุษย์พยายามถ่ายทอดความหมายอย่างมีประสิทธิภาพมากที่สุดเท่าที่จะเป็นไปได้ โดยมีแนวโน้มที่จะใช้คำที่เพิ่มปริมาณข้อมูลที่พวกเขาสามารถสื่อได้มากที่สุด
แนวคิดอีกอย่างหนึ่งก็คือ คำทั่วไปมีแนวโน้มที่จะได้รับความนิยมมากขึ้นเรื่อยๆ เมื่อภาษาแพร่กระจายและพัฒนา ซึ่งนำไปสู่เอฟเฟกต์แบบก้อนหิมะ แต่ไม่มีผู้ใดได้รับการยอมรับอย่างแท้จริงว่าเป็นคำอธิบาย และสาเหตุเบื้องหลังยังคงเป็นปริศนาอยู่เล็กน้อย
หากคุณต้องการส่งตัวเองเข้าสู่วิกฤติการดำรงอยู่บนพื้นฐานของภาษาศาสตร์จริงๆ คุณสามารถวางข้อความ/นวนิยาย/รายงานของคุณเอง (ยาว) ลงในเครื่องคิดเลขการกระจายและดูว่าเป็นไปตามกฎของ Zipf หรือไม่ คุณอาจไม่ชอบที่การใช้ภาษาของคุณดูคาดเดาได้ยาก แต่ก็อย่ากลัวเลยของเช็คสเปียร์แฮมเล็ต ดูเหมือนจะตามมาด้วย