Các công cụ tìm kiếm ngày càng thông minh hơn mỗi năm. Nếu cho đến gần đây họ chỉ tính đến mật độ từ khóa và một số chỉ báo khá lung tung về mức độ liên quan thì giờ đây, một trong những điều kiện quan trọng nhất để đưa một bài báo lên đầu đã trở thành sự tự nhiên của văn bản. Nó có thể được ước tính bằng cách sử dụng phân tích theo định luật Zipf.
Làm thế nào một văn bản được phân tích theo định luật Zipf?
Các cơ chế của công cụ tìm kiếm sao cho văn bản được tạo nhân tạo được coi là không tự nhiên và bị loại khỏi các vị trí hàng đầu trong kết quả tìm kiếm. Làm thế nào để xác định mức độ tự nhiên của văn bản? Nhà ngôn ngữ học người Mỹ George Zipf đã suy ra quy luật tự nhiên của văn bản, theo đó tần suất sử dụng một từ trong văn bản tỷ lệ nghịch với số thứ tự của nó. Có nghĩa là, từ thứ hai xuất hiện thường xuyên hơn một nửa so với từ đầu tiên, từ thứ ba hiếm hơn gấp ba lần so với từ đầu tiên, v.v.
Dựa trên phương pháp toán học đơn giản này, bạn có thể phân tích bất kỳ văn bản nào cho tự nhiên. Một văn bản tuân thủ quy tắc này 30-50 phần trăm được coi là tự nhiên. Tỷ lệ phần trăm càng cao, văn bản trông càng tự nhiên. Đã có những nguồn tài nguyên trực tuyến đặc biệt trên Internet có thể được sử dụng để phân tích một văn bản theo định luật Zipf. Các bài báo có chỉ số dưới 30 phần trăm bị các công cụ tìm kiếm từ chối.
Làm thế nào bạn có thể tin tưởng vào kết quả phân tích văn bản theo Zipf?
Phân tích văn bản Luật của Zipf là một phân tích thống kê phổ biến có tính đến các đặc thù trong cách sử dụng từ của người bản ngữ trung bình. Tất nhiên, có những ngoại lệ đối với quy tắc. Nếu bạn thử đánh giá một số tác phẩm của các nhà văn nổi tiếng theo định luật Zipf, lời khai có thể rất đáng ngạc nhiên. Tuy nhiên, ngôn ngữ của các tác phẩm kinh điển không có xu hướng phù hợp với cách nói thống kê trung bình.
Phân tích văn bản theo Zipf được yêu cầu bởi tất cả những người theo cách này hay cách khác có liên quan đến việc quảng bá các trang web. Đây là những người viết quảng cáo, người lập trình web và người tối ưu hóa SEO. Tỷ lệ tự nhiên của văn bản cao có khả năng cung cấp cho bài viết một vị trí trong đầu công cụ tìm kiếm. Để viết văn bản với phân tích Luật Zipf tốt, bạn cần nhớ rằng các từ khóa nên được sử dụng với các dấu ngắt lớn. Thông thường, khách hàng yêu cầu người thực hiện tạo văn bản với các từ khóa được chỉ định và tần suất sử dụng nhất định. Một văn bản như vậy chắc chắn sẽ có điểm thấp theo phân tích của Zipf. Nhiệm vụ kỹ thuật chính xác là khi khách hàng chỉ đưa chìa khóa cho chính họ, không giới hạn người viết bằng số lần sử dụng chúng trong văn bản. Sau đó, chỉ cần quyết định từ nào sẽ được tìm thấy trong văn bản thường xuyên nhất là đủ và bao gồm tất cả phần còn lại trong bài viết, dựa trên tần suất sử dụng của từ đó.