Ask.com Search Engine นอกสายตา!

ASK.com ¿ เป็นบริการ Search Engine หนึ่งที่ได้รับความนิยมในต่างประเทศ เนื่องจากตั้งชื่อ Web ได้ค่อนข้างสื่อความหมายเป็นอยางมาก เพราะอยากรู้อะไรนะเหรอ ถามเว็บไซต์ ASK (เหมือนถามคำถามยังเว็บบราวเซอร์ อย่างไรอย่างนั้น) ซึ่งหากนับตำแหน่งในตลาด Search Engine นั้น ถูกจัดอยู่ในอันดับที่ 4 เป็นรอง จาก Google Yahoo และ MSN Search เท่านั้น เราลองมาเปิดใจดูหน่อย ว่า Search Engine ที่ชื่อ ASK.com มีดีอะไร และมีข้อแตกต่างอย่างไรเมื่อเทียบกับ Search Engine อัีนดับหนึ่งอย่าง Google ไม่แน่ คีย์เวริ์ด บางคำที่เราค้นหา อาจค้นหาไม่พบหรือไม่ตรงใจจากการ Search จาก Google แต่อาจพบใน ASK.com ก็เป็นไปได้ ….
1. ความสามารถของ ASK
www.ask.com เป็น Search Engine ที่มีความสามารถในการค้นหาคำในลักษณะคำถามคำตอบได้ ASK อยู่ในส่วนแบ่งของตลาด Search Engine ประมาณ 2 % อยู่ในอันดับ 5 มีความสามารถคัดกรองประเ฿ทของการค้นหาได้ ไม่ว่าจะเป็นการค้นหาแผนที่ รูป฿าพ ดิกชันนารี พยากรณ์อากาศ หรือไฟล์เอกสารต่างๆ ที่เก็บไว้ในคอมพิวเตอร์ของผู้คนหา ซึ่งสามารถค้นหาคำเป็นประโยคคำถามโดยใช้หลักการ Neural Language เป็นลักษณะถามตอบ
ASK ใช้โปรแกรมอัตโนมัติ (Robot, Web crawler, Spider) ในการค้นหาและรวบรวมข้อมูลของเว็บไซต์ต่าง ซึ่ง Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่าง ๆ แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Robot มักจะเข้าไปอัพเดทข้อมูล ซึ่งจะเหมาะสำหรับการค้นหาข้อมูลแบบจำเพาะเจาะจง ซึ่งจะทำการ Download Page แรกจาก Web Site ต่างๆ อัตโนมัติตลอดเวลา หลังจากได้ Page แรกแล้ว จะทำการ Load Page ต่อๆ ไป ช่วงนี้จะ Delay เวลาออกไปประมาณ 0.1 วินาที ภายใน 1 ชั่วโมง และทำ Index เพื่อใช้ในการ Search หาข้อมูล โดยใช้ Full-Text ซึ่งดึงคำทุกคำในหน้าเอกสารมาทำ Index และนำหลักการของ Natural Language Processing (NLP) มาใช้ เพื่อให้ค้นหาได้โดยเป็นลักษณะคำถามคำตอบ
2. เทคโนโลยีที่ใช้ใน ASK
ASK ใช้ Algorithm Teoma (เทโอมา) เพื่อดูการ Click ที่มีค่า Popularity สูง ซึ่งเทคนิคการดูค่า Popularity นี้เป็นลิขสิทธิ์ของ ASK แต่เพียงผู้เดียว Teoma ถูกนำมาใช้ใน Search Engine เมื่อปี ค.ศ. 2000 โดย Rutger University ซึ่งถูก Publish Paper ครั้งแรกชื่อ DiscoWeb: Applying Link Analysis to Web Search ซึ่ง Teoma ที่นำมาใช้ใน ASK เป็นเทคนิคที่นำอัลกรอริทึมมาใช้เพื่อดู Popularity ของ Link เพื่อวิเคราะห์ link จากการจัดลำดับเอกสารของแต่ละ Topic
ต่อมา ASK ได้ยกเลิกการใช้ Algorithm Teoma ที่ใช้ใน Search Engine เมื่อปี ค.ศ.2000 โดยทำการ Rebrand ใหม่ หลังจากยกเลิก Teoma แล้ว จึงได้นำ Algorithm ExpertRank มาใช้โดยดูจากความสัมพันธ์หรือความใกล้เคียงของคำที่ต้องการค้นหา เทคโนโลยีการค้นหาของ ASK ไม่ได้ใช้เพียง Link Popularity อย่างเดียว ยังใช้ผู้เชี่ยวชาญในแต่ละหัวข้อกเพื่อตัดสินว่า Page ในมีผู้ให้ความสนใจมาก เรียกอีกอย่างคือ Subject-specific Popularity
Expert Rank เป็น Algorithm ที่ใช้จัดอันดับ จะแสดงผลลัพธ์โดยการเรียงลำดับ ซึ่งเหมือนกับการดูค่า Popularity ของ Link หรือค่า Popularity ของหัวข้อต่าง ๆ ที่มีผู้เลือกใช้จำนวนมาก ส่วนการจัดลำดับของหัวข้อจะใช้ผู้เชี่ยวชาญของหัวข้อนั้นๆ หรือที่ใช้ข้อมูลนั้น โดยการให้เรียงลำดับ Website ที่ Search ได้
โดย Algorithm ExpertRank มี Step การทำงาน 4 ข้อ ดังนี้
1.ทำการ Search หาข้อมูล โดย Query หาข้อมูลจาก Index และหาคำที่มีความสัมพันธ์กันหรือคำที่มีความใกล้เขียงกันในการค้นหา
2.ใช้เทคนิค Clustering มาวิเคราะห์หา Web ที่เกี่ยวกับ Topic ที่ต้องการค้นหา ได้นำหลักการ Text Classification คือใช้ Natural Language Processing ในการตัดคำ เพื่อนำคำไปค้นหา Web Site ที่เกี่ยวข้อง
3.จัดผลลัพธ์ที่ได้จากการ Search เป็นกลุ่ม(Clustering) เพื่อระบุว่า Web Site ไหนมีเนื้อหาหรือหัวข้อตรงตามที่ Search โดยทำการระบุว่า Website ไหนเป็น Web ที่แนะนำ และ Web ไหนเป็น Spam Link ที่ต้องทำการลบออกจากฐานข้อมูล และทำการจัดอันดับของผลลัพธ์ที่ได้โดยดูจากคะแนน
4.จัดลำดับจากผลลัพธ์ที่ได้มาโดยดูจากคะแนน โดยทำการ Weight คะแนนที่ได้จากหลายๆ หัวข้อ หรือหลายๆ กลุ่ม และทำการจัดหมวดหมู่โดยการวิเคราะห์จากผู้ใช้ที่ให้ลำดับไว้
3. ความแตกต่างระหว่าง ASK กับ Google
3.1 Algorithm ที่ใช้ใน ASK ไม่เหมือนกับ Algorithm PageRank ของ Google ซึ่งหลักการPageRank นั้น Search Engine ส่วนมากจะจัดอันดับ Ranking เว็บไซต์ โดยดูว่ามีเว็บไซต์ที่ลิงค์มายัง เว็บไซต์นั้นเท่าไร สิ่งนี้เรียกว่า Incoming ลิงค์ โดยเฉพาะ Google นั้นจะพิจารณา Link Popularity เป็นปัจจัยสำคัญในขั้นตอนการจัดอันดับ Search Engine บางตัวจัดอันดับโดยดูว่าเว็บไซต์นั้นลิงค์ ไปยังที่อื่น Outgoing ลิงค์เท่าไร แต่ลิงค์เหล่านั้นต้องลิงค์ไปยังเว็บไซต์ที่จัดว่าอยู่ในประเภทเดียวกันเท่านั้น การแลกเปลี่ยนลิงค์ระหว่างเว็บไซต์ที่อยู่ในประเ฿ทเดียวกันนั้นจะเป็นประโยชน์อย่างมากต่อทั้ง 2 ฝ่าย ดังนั้นจึงมีความนิยมอย่างมากในการแลกเปลี่ยนลิงค์ประเภทนี้
3.2 Google ไม่ได้นำเทคนิค Natural Language Processing มาใช้ในการค้นหา จึงทำให้เสียเปรียบ ASK เนื่องจากถ้าผู้ค้นหา ใส่คำที่ต้องการค้นผิด ASK จะทำการหาคำใกล้เคียงที่มีค่า Popularity มากที่สุดมาแสดง แต่ถ้าเป็น Google เมื่อใส่คำผิด จะไม่แสดงผลลัพธ์ใดๆ จากการค้นหา เนื่องจากหาคำเหล่านั้นไม่เจอ จึงเป็นข้อเสียของ Google
3.3 Ask สามารถแสดงหน้า Web Page ที่ทำการค้นหาได้ก่อน โดยไม่ต้องคลิก Link เข้าไป ทำให้ผู้ใช้สามารถเห็นหน้า Web ได้ก่อน เพื่อเป็นการช่วยตัดสินใจว่า Link นี้น่าสนใจหรือไหม

฿าพที่ 1 แสดงหน้าจอหลักของ Search Engine ASK

฿าพที่ 2 แสดงหน้าจอผลลัพธ์จากการค้นหาเป็นคำถามคำตอบ

฿าพที่ 3 แสดงหน้าจอผลลัพธ์จากการค้นหาเป็นคำค้นเฉพาะ

ภาพที่ 4 แสดงหน้าจอผลลัพธ์จากการค้นหาที่สามารถแสดง Page ที่ Link ไป
4. Reference
[1] Available to http://www.ask.com
[2] Available to http://www.crs4.it/ict/dart06/slides/savona.pdf
[3] Available to http://en.wikipedia.org/wiki/Ask.com
[4] Available to http://googlesystem.blogspot.com/2006/03/expertrank-authoritative-search.html
ขอบพระคุณที่สนใจอ่าน