Որոնիչները ամեն տարի ավելի խելացի են դառնում: Եթե մինչ վերջերս նրանք հաշվի էին առնում միայն հիմնաբառերի խտությունը և կարևորության որոշ բավականին ցնցող ցուցիչ, ապա հոդվածը վերև անցնելու ամենակարևոր պայմաններից մեկը դարձել է տեքստի բնականությունը: Այն կարելի է գնահատել ՝ օգտագործելով վերլուծությունը Zipf- ի օրենքի համաձայն:
Ինչպե՞ս է վերլուծվում տեքստը Zipf- ի օրենքի համաձայն:
Որոնիչների մեխանիզմներն այնպիսին են, որ արհեստականորեն առաջ բերված տեքստը ճանաչվում է որպես անբնական և բացառվում է որոնման արդյունքների գլխավոր դիրքերից: Ինչպե՞ս որոշել տեքստի բնականության մակարդակը: Ամերիկացի լեզվաբան Georgeորջ ipիֆֆը հանում է տեքստի բնականության մասին օրենքը, ըստ որի ՝ տեքստի մեջ բառի օգտագործման հաճախականությունը հակադարձ համեմատական է դրա հերթական համարին: Այսինքն ՝ երկրորդ բառը տեղի է ունենում առաջինից կես անգամ հաճախ, երրորդը երեքից հազվադեպ է լինում առաջինից և այլն:
Այս պարզ մաթեմատիկական մեթոդի հիման վրա դուք կարող եք վերլուծել ցանկացած տեքստ բնականության համար: Բնական է համարվում այն տեքստը, որը 30-50 տոկոսով համապատասխանում է այս կանոնին: Որքան բարձր է տոկոսը, այնքան ավելի բնական է տեքստը: Համացանցում արդեն կան հատուկ առցանց ռեսուրսներ, որոնք կարող են օգտագործվել Zipf- ի օրենքի համաձայն տեքստի վերլուծության համար: 30 տոկոսից պակաս ցուցանիշ ունեցող հոդվածները մերժվում են որոնիչների կողմից:
Ինչպե՞ս կարող եք վստահել ըստ Zipf- ի տեքստի վերլուծության արդյունքներին:
Zipf- ի օրենքի տեքստի վերլուծությունը ընդհանուր վիճակագրական վերլուծություն է, որը հաշվի է առնում միջին բնիկ խոսնակի կողմից բառերի օգտագործման առանձնահատկությունները: Իհարկե, կան բացառություններ կանոնից: Եթե փորձեք գնահատել հայտնի գրողների որոշ աշխատանքներ ըստ Zipf- ի օրենքի, վկայությունը կարող է շատ զարմանալի լինել: Այնուամենայնիվ, դասականների լեզուն հակված չէ տեղավորվել միջին վիճակագրական խոսքի մեջ:
Տեքստի վերլուծությունը ըստ Zipf- ի պահանջում է յուրաքանչյուր ոք, ով այս կամ այն կերպ կապված է կայքերի առաջխաղացման հետ: Սրանք հեղինակներ, վեբ ծրագրավորողներ և SEO օպտիմիզատորներ են: Տեքստի բնականության բարձր տեմպերը, ամենայն հավանականությամբ, հոդվածին տեղ կընձեռեն որոնիչի վերևում: Zipf- ի Օրենսդրության լավ վերլուծությամբ տեքստ գրելու համար հարկավոր է հիշել, որ հիմնաբառերը պետք է օգտագործվեն մեծ ընդմիջումներով: Հաճախ հաճախորդները կատարողներից պահանջում են ստեղծել տեքստեր նշված հիմնաբառերով և օգտագործման որոշակի հաճախականությամբ: Zipf- ի վերլուծության համաձայն, նման տեքստը, անշուշտ, ցածր գնահատական կունենա: Technicalիշտ տեխնիկական խնդիրն այն է, երբ հաճախորդը տալիս է միայն բանալիները `առանց սահմանափակելու հեղինակային իրավունքի հեղինակները տեքստում դրանց օգտագործման քանակով: Այդ դեպքում բավական է որոշել, թե որ բառն է ամենից հաճախ հայտնաբերվել տեքստում, իսկ մնացած բոլորն էլ ներառել հոդվածում ՝ ելնելով դրա օգտագործման հաճախությունից: