Search This Blog

Tuesday, August 16, 2011

Search engines and politics (2): democratic tools????????????

จากตอนที่แล้ว Search Engines: democratic tools กับความหวังที่จะมีสื่อที่เสรี ไม่จำกัดค่ายใหญ่ ไม่จำกัดความคิด ของอินเตอร์เน็ต แต่ครั้นเมื่อเวลาผ่านไปไม่นาน อินเตอร์เน็ตก็ตกอยู่ในเงื้อมมือของกลุ่มใหญ่เพียงไม่กี่กลุ่ม กลุ่มใหญ่ๆ เหล่านี้สร้างฮับ เพื่อเชื่อมโยงลิ้งก์ที่เกี่ยวข้องเข้าด้วยกัน และก็กลายเป็นตัวกำหนดว่าใครจะถูกรวมอยู่ในกลุ่มหรือใครจะไม่ถูกรวม เว็บที่ถูกเห็นบ่อย หรือ highly visibility มีอยู่แค่ไม่กี่หน้า เป็นจำนวนน้อยมากเมื่อเทียบกับเว็บเพจที่มีอยู่ ยากที่คนธรรมดาทั่วไปจะแสดงความเห็นแล้วจะมีคนสนใจ ถ้าไม่มีเจ้าใหญ่เหล่านี้มาลงสนับสนุน ซึ่งขัดกับหลักการการเป็นสื่อของทุกคน หรือ egalitarian หรือ หลักพื้นฐานของประชาธิปไตย democracy ไปเสียแล้ว

การที่ข้อมูล ข่าวสารนั้นมีอยู่มากมาย จากหลากหลายช่องทาง วิทยุ โรทัศน์ หนังสือพิมพ์ ไม่มีทางที่เราจะมีเวลาเข้าถึงข้อมูลเหล่านั้นได้หมด ดังนั้นสื่อเหล่านี้จึงทำหน้าที่เหมือนเป็นตัวกลาง intermediaries และบทบาทนั้นก็ยิ่งสำคัญมากในข้อมูลออนไลน์ที่มีมากมายจนไม่มีทางเข้าถึงได้อย่างทั่วถึงเป็นแน่แท้ ตัวกลางสำคัญ intermediaries of online ก็คือ Search engines นั่นเอง

ในปี 2004 ประมาณว่าอเมริกันชนกว่าร้อยละแปดสิบใช้ Search engines และส่วนใหญ่จะเข้าใช้อย่างน้อยวันละหนึ่งหน search engines จึงเป็นเครื่องมือที่นิยมที่สุดในการ เข้าถึงข้อมูลการแพทย์ การเมือง ศาสนา และแทบทุกๆอย่างบนโลกออนไลน์ กล่าวกันว่าเกือบร้อยละแปดสิบของผู้มีสิทธิเลือกตั้งในสหรัฐ หาข้อมูลผู้สมัครโดยเริ่มต้นที่ Search Engines (ในประเทศที่เจริญแล้ว การใช้อินเตอร์เน็ตจึงมีบทบาทสำคัญมากในทุกๆด้าน และเขาจึงสนใจศึกษาผลกระทบของมันอย่างมาก ในบ้านเรา ผลกระทบตรงนี้ ยังไม่ชัดนัก เนื่องจากการใช้อินเตอร์เน็ตยังกระจุกตัวอยู่เฉพาะในชนชั้นกลางในเมือง)

Search ENgines  จึงทำหน้าที่เหมือน ผู้รักษาประตู คอยทำหน้าที่ให้ใครผ่านเข้าออกได้ เมื่อเราคาดว่า อินเตอร์เน็ตจะเป็นสื่อกลางสำหรับประชาธิปไตย democracy เราจึงตั้งคำถามแบบเดียวกับที่ตั้งคำถามกับสื่อแบบเก่า ว่า ทำไมหรือทำอย่างไร ที่ จะให้ความคิดเห็นที่หลากหลาย และมักไม่ได้แสดงออก ได้มีที่ยืน และสามารถผ่านตัวกรองคือ Search Engines ได้เหมือนความเห็นกระแสหลัก การโฆษณาส่งผลอย่างไรต่ออินเตอร์เน็ต

ความจริงจะเข้าใจเรื่องนี้ คงต้องเข้าใจหลักการทำงานของกูเกิ้ล Google หรือ Search engines อื่นๆ เสียก่อน จึงจะเข้าใจได้ดีขึ้น ดังนั้นในตอนหน้าเราจะกล่าวถึงการทำงานของ Search Engines อย่างคร่าวๆ ก่อนที่จะกลับมาพูดกันในเรื่องบทบาทของ Search engines and politics, business และทางสังคมอื่นๆ กันต่อไป

Friday, August 12, 2011

Search Engines and politics: Democratic tools?

อย่างที่เล่าไว้ตอนที่แล้วว่า จะมาเล่าถึงบทบาทของ Search Engines กับสังคม เศรษฐกิจและการเมือง ซึ่งผมจะถอดความมาจากหนังสือ Web Search: Multidisciplinary Perspectives โดย มีบรรณาธิการคือ Amanda Spink and Michael Zimmer ซึ่งคนแรกเป็นศาสตราจารย์ด้าน เทคโนโลยีสารสนเทศของมหาวิทยาลัย Queensland University of Technology, Brisbane และคนหลังเป็น เจ้าหน้าที่โครงการสังคมข้อมูล ของ Yale Law School
ในปัจจุบัน ข้อมูล ความรู้ การค้า และการเมือง ต่างถูกนำขึ้นไปสู่ออนไลน์ โดยเฉพาะเว็บต่างๆ ทำให้เครื่องมือค้นหาหรือ Search Engines กลายเป็นเครื่องมือสำคัญในการเป็นผู้กำหนดการเข้าถึงในไซเบอร์สเปซ และ Google ซึ่งเป็น Search Engines ที่สำคัญที่สุด มีผู้ใช้มากที่สุดจึงมีบทบาทในการกำหนดการเข้าถึงเนื้อหาของผู้ใช้นับร้อยล้านคน ถ้าเราเชื่อว่า การเข้าถึงสื่อต่างๆ ควรเป็นไปตามหลักการประชาธิปไตย Democracy เราก็ควรจะคาดหวังว่า Search engines จะเป็นตัวกระจายข้อมูลในแต่ละเรื่องไปสู่ผู้ใช้อย่างรอบด้าน ไม่ถูกจำกัดด้วยอคติบางอย่าง
ตามหลักการก็คือการที่สาธารณะจะสามารถควบคุมรัฐบาลของตนเองได้ จะต้องได้รับข้อมูลรอบด้าน หลากหลาย และ ข้อมูลฝั่งตรงข้าม ไม่ใช่รับรู้แต่เฉพาะเหตุผลใดเหตุผลหนึ่งซึ่งอาจจะดีก็ได้ แต่ถ้าไม่รู้เหตุผลอื่น ก็คงไม่สามารถตัดสินได้ว่ามันเป็นเหตุผลที่ดีที่สุด โดยเหตุผลนั้น ไม่จำเป็นว่าจะต้องได้รับความนิยม จะมีใครบอกว่าถูกหรือผิด จะทำให้คนพอใจ หรือ เป็นการโจมตีใครโดยเฉพาะ สิ่งสำคัญก็คือ จะต้องให้สาธารณะได้มีโอกาสตัดสินใจได้อย่างถูกต้องเมื่อมีอะไรผิดพลาด
ในปัจจุบันที่สังคมและคนมากมาย กระจัดกระจายกันอย่างกว้างขวาง จนไม่สามารถแลกเปลี่ยนข้อมูลกันได้โดยตรง สื่อไม่ว่าจะเป็นวิทยุ โทรทัศน์ หนังสือพิมพ์ จะเป็นตัวกลางในการนำข่าวสารข้อมูลไปสู่คนทั่วไปโดยไม่ต้องมาพบปะกันโดยตรง ซึ่งควรจะต้องเป็นพื้นที่สาธารณะไม่เอื้อประโยชน์หรือรับใช้กลุ่มการเมือง บริษัท หรือ อภิสิทธิ์ชนใดๆ เป็นพิเศษ แต่ด้วยระบบแบบการตลาด และการแทรกแซงจากรัฐบาล ทำให้สื่อทางหลักเอาชนะสื่อทางเลือก เพราะสื่อต่างๆ ก็ล้วนมุ่งหวังผลกำไรสูงสุด ทำให้สื่อต่างๆ ล้วนนำเสนอเรื่องคล้ายๆ กัน เรื่องที่จะนำไปสู่ ความรู้สึกอยากซื้อสินค้า บริการ และหลีกเลี่ยงเรื่องที่จะนำไปสู่คามขัดแย้ง โดยไม่มีพื้นที่สำหรับความเห็นต่าง และหลากหลาย
อินเตอร์เน็ตเป็นเครื่องมือล่าสุดที่คาดหวังว่า จะเป็นการกระจายข้อมูลจากศูนย์กลาง ทีทุกคนสามารถเข้าถึง ทุกความคิดเห็นที่แตกต่างกัน โดยปราศจากข้อจำกัด ด้าน เวลา ระยะทาง และเนื้อหา แม้ว่าจะมีความคล้ายคลึงกับสื่อสิ่งพิมพ์ (ปัจจุบันด้วยความเร็ว ในการนำสัญญาณ ข้อจำกัดตรงนี้ยิ่งน้อยลง เพราะเว็บต่างๆ สามารถเสนอ มัลติมีเดียได้อย่างมีประสิทธิภาพ – ผู้เขียน) ไม่มีอาณาจักรสื่อใด จะมาเป็นตัวกรองความคิดเห็น ใครอยากสื่ออะไรถึงใครก็สามารถทำได้ ขอให้สามารถเข้าถึงคอมพิวเตอร์ได้ก็เท่านั้น แม้แต่กลุ่มที่มาจากรากหญ้า ก็มีกระบอกเสียงของตัวเอง (หนังสือนี้ผู้เขียนเป็นอเมริกัน ซึ่งผู้ใหญ่กว่าร้อยละแปดสิบสามารถเข้าถึงและใช้อินเตอร์เน็ตในการหาข้อมูล ซึ่งคงไม่สามารถนำมาเปรียบเทียบกับประเทศอื่นๆ เช่นประเทศไทย ซึ่งตามข้อมูลมีผู้ใช้อินเตอร์เน็ต ประมาณสิบหกล้านคน ซึ่งน่าจะประมาณห้าสิบเปอร์เซ้นต์ของผู้ใหญ่เท่านั้น และรากหญ้าไม่สามารถเข้าถึงอินเตอร์เน็ตได้-ผู้ถอดความ) ความหวังดังกล่าวจะเป็นจริงอย่างที่หวังหรือไม่ จะมาเล่าต่อในครั้งหน้า

Sunday, August 7, 2011

Who is who and who is survived in search engines business? War games!

เราพอจะรู้อะไรบางอย่างมาจากสองตอนที่แล้ว ว่าอะไรน่าจะเป็นโปรแกรมค้นหาในเว็บ และอะไรที่ไม่ใช่ เช่น ฐานข้อมูล วันนี้เรามาดูประวัติคร่าวๆ ของการพัฒนาวงการ Search Engines อาจจะทำให้เราเห็นภาพของ search engines ที่ชัดเจนขึ้น นอกจากนี้ ยังเห็นการเกิด การดับ การแข่งขัน แย่งชิงพื้นที่ เป็นวัฏจักรทางความคิด การค้า และธุรกิจ ที่หนีไม่พ้น เกิด ดับ เหมือนทุกสิ่งในโลก

Search engines มีรากมาจาก Information Retrieval Systems ระบบการดึงข้อมูลมาใช้ ซึ่งพัฒนาโดยบริษัทยักษ์ใหญ่ในวงการคอมพิวเตอร์ IBMs ช่วงทศวรรษ 50 หรือราวๆ หกสิบปีที่แล้ว และต่อมาเมื่อข้อมูลเพิ่มขึ้นอย่างมากมายการต้องมีเครื่องมือโปรแกรมในการค้นหาจึงเป็นเครื่องมือที่หลีกเลี่ยงไม่ได้ และได้พัฒนาอย่างมากในช่วง ประมาณยี่สิบปีที่ผ่านมานี้

เครื่องมือค้นหาแรกๆ เลยชื่อว่า Archie (Archive ตัดตัว V) 1990 โดยนักเรียนคอมพิวเตอร์ของมหาวิทยาลัยแมกกีล ของแคนาดา โดยโปรแกรมจะดาวน์โหลดไดเรกตอรี่ของชื่อไฟล์ที่อยู่บนพับลิกโดเมนของ FTP แต่ไม่ได้ ทำดัชนีเนื้อหา เพราะตอนนั้น ข้อมูลน้อยมากสามารถทำมือเองได้

Veronica, Jughead เป็นโปรแกรมคล้ายๆ กัน กับอาร์ชี่ ของ บริษัท Gopher 1991

W3Catalog Search Engines รุ่นดึกดำบรรพ์เริ่มในปี 1993

Jumpstation 1993 เริ่มใช้ Web robot เพื่อค้นและสร้างดัชนี

จนในปี 1994 บริษัทแรกที่ใช้ระบบมาตรฐานนี้ ก็เปิดสู่สาธารณะ คือ ไลคอส แต่ชะตากรรมจะเป็นอย่างไร อ่านตอนท้ายของเรื่องนี้

Search Engines ดังในอดีตก็มี Excite, Infoseek, Inktomi, Northern Light, Alta Vista ซึ่งยังใช้การอยู่ แต่แปรรูปไปบ้าง เช่น อิงค์โทมี่ และ อัลตา วิสต้า ที่ควบเป็นของยาฮูไป

Yahoo! เป็นแบรนด์แรกๆ ที่ให้บริการค้นหา (1994) แต่ไม่มี Search engines โดยแรกๆ เป็น Directory ที่ค้นได้ โดยต้องใช้มนุษย์เป็นคนจัดการแยก ปี 2003 ซื้อกิจการของ Inkyomi ทีกำเนิดมาแต่ 1995 และให้บริการแก่ Search engines อื่นๆ มาก่อน พอถูกซื้อ ก็ทำให้ยาฮูมีเครื่องมือค้นหาจริงๆ ต่อมาได้รวม Overture ซึ่งในปี 2001 (Goto.com 1997) ซื้อ Altavista เมื่อ 2003 (Start 1999) และ Alltheweb(start 1999) และจึงได้ รีแบรนด์เป็น Yahoo Search marketing 2005 Yahoo! ใช้เทคโนโลยีของกูเกิ้ลอยู่พักนึงก่อนได้โอเวอร์ทูร์ และล่าสุดก็หันไปซบกับบิงของไมโครซอฟท์แทน

Microsoft เริ่มใช้ MSN search ในปี 1995 (พร้อม Windows 95) โดยช่วงแรกเทคโนโลยี Search Engines ที่มีอยู่แล้ว ได้แก่ Inktomi, Looksmart, Alta Vista และในที่สุดในปี 2004 ก็มี Technology search engines ของตัวเอง และเปลี่ยนมาเป็น Live Search ปี 2004 และล่าสุด Microsoft ได้รีแบรนด์ตัวเอง และกำเนิดSearch engines ในชื่อ Bing เมื่อ กรกฎา 2009 และหลังจากนั้นไม่ถึงเดือน Yahoo! ก็ตกลงร่วมกับ Microsoft ว่าจะใช้ Bing technology และไม่นานมานี้ google ก็กำลังดำเนินการฟ้องร้อง Microsoft ว่าลอกเลียนหรือใช้ข้อมูลของกูเกิลในเครื่องมือค้นหา Bing ไมโครซอฟท์จึงมีทั้งโอเปอเรตติ้งซิสเต็ม อีเมล เว็บบราวเซอร์ และเสิร์ชเอนจิ้นของตนเอง

Google เริ่มในราวปี 1998 โดยนักเรียนปริญญาเอกจากมหาวิทยาลัยสแตนฟอร์ด สองปีเท่านั้น กูเกิลได้กลายเป็น Search engines ที่ใช้กันเพิ่มอย่างมาก และใช้เทคนิค page ranking เพื่อให้ความสำคัญกับเพจที่มีลิ้งค์มามาก แสดงว่าน่าจะสำคัญกว่าเพจอื่นๆ กูเกิ้ลกลายเป็นบริษัทมหาชนในปี 2004 และกลายเป็นเครื่องมือที่ครองตลาดค้นหา และยังซื้อควบกิจการต่างๆ เข้ามาในเครือข่าย ไม่ว่าจะเป็น You Tube กำเนิดธุรกิจบนอินเตอร์เน็ต Adwords, Adsense, Affiliate Program,bloggerมีเว็บบราวเซอร์และอีเมลของตัวเอง แม้ว่าอินสแตนท์เมสเสจไม่ได้รับความนิยมนัก และล่าสุดก็มี Googleplus ที่คาดว่าจะมาแย่งพื้นที่ของ Facebook ทำให้กูเกิ้ลเป็นมากกว่า Search engines ที่ทรงพลัง กูเกิ้ลยังมีแชร์ และช่วยเสริม Search Engines ของ AOL บริษัทที่ทำธุรกิจหลักเกี่ยวกับซอฟท์แวร์คอมพิวเตอร์ และ วีดิโอ ของบริษัทวอร์เนอร์ ซึ่งเข้ามาผนวกกิจการไป ถ้าเอโอแอลหันไปหา ไมโครซอฟท์ตามที่มีคนคาดไว้ กูเกิ้ลจะเสียส่วนแบ่งไป พอสมควรที่เดียว

ยังมีอีกสองเจ้าที่อยากจะพูดถึง เพราะบริษัทต่างๆ ที่มีการทำกำไรระดับโลกนั้นมักจะมีแหล่งกำเนิดในอเมริกา แต่ Baidu ยักษ์ใหญ่ของจีนที่ออกสตาร์ทในปี 2000 ซึ่งครองตลาดหลักกว่าร้อยละหกสิบในจีน ทำให้มีส่วนแบ่งทั่วโลกไม่น้อยเลย อีกเจ้าหนึ่งคือ Lycos ซึ่งมีมาแต่แรกๆ ไล่เลี่ยกับ ยาฮู ต่อมาไม่สามารถแข่งขันกับเจ้าพ่อ กูเกิ้ล ยาฮู ไมโครซอฟท์ได้ ก็ขายกิจการส่วนSearch Engines ยกเว้นของยุโรปให้บริษัทเกาหลี Daum ในปี 2004 ต่อมา
บริษัทดอมก็ซื้อกิจการส่วนยุโรปมา และในที่สุด บริษัทอินเดีย ก็ซื้อกิจการในปี 2010 และกลายเป็นกิจการระดับโลกอีกครั้ง เพราะบริษัทนี้ มีกิจการในออสเตรเลียด้วย แม้จะไม่ใหญ่ยักษ์เท่าบริษัทอื่น แต่ก็ยังมีคนกว่าหกสิบล้านคนทั่วโลกใช้บริการ Lycos ในแต่ละปี

ทุกวันนี้ ห้ายักษ์แห่งวงการที่ มีผู้ใช้บริการมากที่สุดจากการสำรวจ ในปีนี้ (August 2011) ได้แก่
1.Google
2.Bing
3.Yahoo!
4.Ask
5.AoL search


สำหรับรายละเอียด สิบห้าอันดับยอดนิยม จำนวนผู้ใช้ ดูได้จาก http://www.ebizma.com/articles/search-engines

จะเห็นว่า Search Engines นั้นโตมาจากความจำเป็นเนื่องจากการเติบโตของอินเตอร์เน็ต และเวิร์ลไวด์เว็บ และข้อมูลออนไลน์ จากเริ่มต้นด้วยนักศึกษามหาวิทยาลัย ก็กระจายออกสู่ภาคธุรกิจ ส่วนใหญ่ การค้นหายังคงทำได้ฟรี แต่บริษัทเหล่านี้ก็จะโยงใยกับธุรกิจต่างๆ ของตัวเอง ทำให้มีอิทธิพลมากมายในการกำหนดเศรษฐกิจ และการตลาดของตัวเอง มีการโฆษณา และกิจการอื่นๆ อีกมากมายควบคู่ไป และยังส่งผลกระทบต่อพฤติกรรม ทางสังคมและการเมือง และมีข้อถกเถียงมากมายถึงจริยธรรม ความปลอดภัย ความเป็นส่วนตัว แต่ก็ปฏิเสธไม่ได้ว่าได้กลายเป็นเครื่องมือการเข้าถึงข้อมูล ซึ่งอาจจะเป็นประโยชน์ในการศึกษา หาความรู้ของ มนุษยชาติได้อย่างที่ไม่เคยมีมาก่อน

มาถึงตอนนี้เราจะได้เห็นภาพของ Search Engines ในแง่เทคนิค ความหมายว่าเป็นโปรแกรม บางอย่าง และได้รู้ว่าอะไรบางอย่างเช่น ฐานข้อมูลที่ไม่ใช่เครื่องมือค้นหา มาตอนนี้เราก็รู้ว่ามีอะไรบ้างที่ยังอยู่ในความนิยมสำหรับโปรแกรมค้นหาข้อมูลเหล่านี้ และภาพการแข่งขันทางธุรกิจ และได้เกริ่นนำถึงภาพรวมผลกระทบที่อาจจะเกิดขึ้นทางการศึกษา วัฒนธรรมม สังคม การเมือง จริยธรรม และอื่นๆ อีกมาก ซึ่งจะมาพูดถึงเรื่องนี้ในคราวหน้า ก่อนจะกลับมาที่เรื่องหนักๆ เช่น มันทำงานยังงัย ทำอย่างไรจะใช้มันได้ประโยชน์ที่สุด ต่อไป

Search Engines, Desktop Search, Web search engines, Web navigation, Database Search, Mobile Search

คราวที่แล้วเราได้พูดถึงความหมายของ Search Engines โดยเอาความหมายมาจากพจนานุกรมฉบับหนึ่ง ทำให้เราพอรู้คร่าวๆแล้วว่า Search Engines เป็นโปรแกรมอันหนึ่ง ที่เราใส่ key words หรือสิ่งที่แท็กกับสิ่งที่เราต้องการค้นหาข้อมูล แล้ว โปรแกรมก็จะส่งผลลัพธ์ออกมาให้เรา แต่ไม่ได้จำกัดว่าเป็นบนคอมพิวเตอร์ของเรา Local Network หรือ World Wide Webs หรือ บน Websites นั้นๆ แต่ในความหมายทั่วไปที่เราใช้กันทั่วไป คือความหมายอย่างแคบ เราหมายถึง Web search engines เท่านั้น ไม่ได้รวม Desktop search, Local Search, Web Navigation แต่อย่างใด นอกจากนี้เดี๋ยวนี้ก็ยังมี Mobile Search, Searching ใน Social Network ซึ่งเป็นอีกหลายอันที่แตกแขนงออกไป ดังนั้นต่อไปนี้ถ้าบอกถึง Search Engines เฉยๆ ผมจะหมายถึง Web search engines แต่ถ้าจะบอกกล่าวลงรายละเอียดลงไป ก็จะบอกไว้เป็นกรณีๆ นอกจาก โปรแกรมที่ใช้ค้นหาจะแยกเป็นค้นหาจากคอมพิวเตอร์ส่วนตัว เครือข่าย Web navigation, Web search engines อุปกรณ์สื่อสาร แล้วก็ยังมีรายละเอียดปลีกย่อย เกี่ยวกับ Web search engines ที่เราจะเล่าลงรายละเอียดกันต่อไป
ยังอาจจะมีคำถามเกิดขึ้นอีก เช่น Wikipedia เป็น Search Engines หรือไม่ ตำคอบก็คือ ไม่ วิกิพีเดีย เป็น ฐานข้อมูล Online ขนาดใหญ่ที่มี Entry กว่าสามล้านเรื่อง และเพิ่งฉลองครบสิบปีไปเมื่อไม่นานมานี้ แต่การค้นหาในวิกินั้น อาจจะใช้ Search Engines ทั่วๆไป เช่น Google ในการค้นหาซึ่งเรามักจะพบว่า หน้าของวิกิ มักจะปรากฏเป็นอันดับต้นๆ เสมอ หรือจะใช้ Search Engines ที่วิกิพัฒนาขึ้นเอง เพื่อค้นหาข้อมูลในวิกิโดยเฉพาะ ซึ่งก็มีเรื่องราวน่าสนใจมาเล่าให้ฟังกันต่อไป
ดังนั้นก็สามารถบอกได้ว่าฐานข้อมูลอื่นๆ ที่สืบค้นได้ (searchable database) ไม่ว่าจะเป็น Public เช่น Pubmed ฐานข้อมูลออนไลน์ (พัฒนามาจากฐานข้อมูลออฟไลน์ Medline) abstract ของเปเปอร์การแพทย์ สาธารณสุข วิทยาศาสตร์ชีวภาพ ของ National Congress Biotechnology Information (NCBI) ของอเมริกา หรือต้องลงทะเบียนจ่ายค่าบริการเพื่อค้นหาก็ตาม ต่างก็ไม่ใช่ Search Engines นั่นคือฐานข้อมูล ไม่ใช่โปรแกรมค้นหา แต่ฐานข้อมูลเหล่านี้อาจจะมีโปรแกรมค้นหาที่ใช้เพื่อค้นหา ข้อมูลจากฐานข้อมูลนั้นๆ เฉพาะได้ เช่น Wikiseek ของ วิกิพีเดีย หรือ Entrez ของ Pubmed (และฐานข้อมูลทั้งหมดของ NCBI) แผนภาพอาจจะทำให้พอเข้าใจมากขึ้น

Saturday, August 6, 2011

Search Engines คืออะไร

เวลาเราจะพูดถึงเรื่องอะไร สิ่งสำคัญก็คือเราจะต้องรู้ว่าเรื่องนั้นคืออะไร ไม่อย่างนั้น เราก็จะพูดไปตามที่ตัวเองจะคิด จะสื่อ ซึ่งอาจจะไม่ตรงกัน เป็นสาเหตุของการสื่อสารล้มเหลว เมื่อท้ายที่สุดพบว่าเราคุยกันคนละเรื่องละราว ผมกำลังจะพูดเรื่องนิยาม ความหมาย คำจำกัดความ คอนเซปต์ ความคิดรวบยอด หรือ กรอบคิด หรือ มโนมติ มโนทัศน์ หรืออะไรก็แล้วแต่ เพื่อจะช่วยให้เราไม่ไถลไปนอกกรอบจนเกินไป และในบล็อกนี้เราก็จะพูดกันในเรื่องของ Search Engines นี่แหละ ทีนี้ปัญหาก็คือเราจะว่ากันในบล็อกไทยๆ เราก็ต้องดูว่ามีคนใช้คำนี้ในภาษาไทยไหม มันสื่อความหมายเท่ากันหรือไม่ เพราะภาษาแต่ละภาษาก็ไม่เท่ากัน ก็จะดูเป็นเรื่องวุ่นวาย ซึ่ง ไว้จะหามาเล่าเรื่องนี้กันทีหลัง เอาเป็นว่า จะใช้คำในภาษาอังกฤษ เพื่อตีวงกันเข้ามาเสียก่อน

ในเรื่องของการนิยามอะไรบางอย่าง นี่ก็เป็นเรื่องยากวุ่นวาย ไม่ใช่เรื่องง่ายๆ อย่างที่เราเข้าใจ และไม่มีวิธีไหน จะสมบูรณ์ไร้ข้อบกพร่อง แต่เราคงไม่ต้องเอากันขนาดนั้น เอาเป็นว่าผม คุณผู้อ่าน พอจะเข้าใจว่าเราพูดเรื่องเครื่องมืออะไรที่ว่านี่ ก็แล้วกัน ไม่ได้ว่าเรื่องอื่นๆ ที่ไม่เกี่ยวข้อง

กรอบแรกที่ต้องล้อมรั้วก็คือ เราพูดกันเรื่องเครื่องมือค้นหา Search Engines เฉพาะที่เกี่ยวกับคอมพิวเตอร์เท่านั้น แต่มันก็นึกไม่ออกนะครับ ว่าถ้าไม่ได้พูดถึงคอมพิวเตอร์แล้วมันจะหมายถึงอะไร เพราะคำนี้มีที่ใช้ครั้งแรกเมื่อปี 1984 ตาม Merriam Webster Dictionary บอกเอาไว้ และก็มีความหมายเกี่ยวกับคอมพิวเตอร์นี่แหละ แต่ถ้าเอาภาษาไทย ว่า เครื่องมือค้นหา แล้วมันอาจจะเขวออกไปหมายถึง นาวิเกเตอร์ หรือ เครื่องไม้เครื่องมือบางอย่าง (เช่น GT 200 ที่เป็นข่าวครึกโครมในเมืองไทย ราวปี 2010 คนขายก็พวกฝรั่งขี้โกง คนไทยที่ซื้อ ก็พวกฉ้อราษฎร์ในกองทัพ) นั่นเอง

เอาล่ะ ก็พอได้ความว่ามันคงเกี่ยวกับคอมพิวเตอร์ก็แล้วกันนะ ตามชื่อ มันก็ต้องเป็นเครื่องไม้เครื่องมือ แล้วก็ใช้ค้นอะไรเนี่ยแหละ เราก็มาดูความหมายที่ว่าไว้ตามที่ต่างๆ (อันนี้เขาเรียกความหมายตามพจนานุกรม ซึ่งบางคนก็ว่า เป๊ะสุด บางคนก็ว่า คนทำพจนานุกรมมีหน้าที่ไปดูว่าเขาใช้คำในความหมายว่าอย่างไร แล้วก็มาเขียนนิยามให้ดู คือแบบแรก ภาษาห้ามดิ้น แบบที่สอง ภาษาดิ้นได้ จริงๆ ภาษามันอยู่ตรงกลาง ดิ้นมาก ก็ไม่เข้าใจกันพอดี เป๊ะมาก ก็บางทีก็ใช้ไม่ตรงความต้องการ)

ตามเว็บสเตอร์ Search Engine คือ ซอฟท์แวร์คอมพิวเตอร์ ที่ใช้เพื่อค้นหาข้อมูล (Data) เพื่อให้ได้ข้อมูลจำเพาะ (specified information) รวมถึง ไซต์บน เวิร์ลด ไวด์ เว็บ (world wide web) ที่ใช้โปรแกรมหรือซอฟท์แวร์ เพื่อหาคีย์เวิร์ด (keyword) ในไซต์อื่นๆ

ตอนนี้ ท่านที่กำลังงง และไม่งง แต่ผมกำลังจะทำให้งง ก็คงจะเริ่มงงกันไปตามๆ กัน จริงๆ ถ้าสันนิษฐาน ว่าท่านหลุดเข้ามาอ่านบทความนี้ได้ ก็สันนิษฐานว่าท่านคงจะต้องใช้ Search Engines ได้ และมีความรู้เรื่องเทคโนโลยี และ อินเตอร์เน็ต เป็นอย่างดี และคุ้นกับคำเหล่านี้ได้พอสมควร แต่ถ้าผมเดินดุ่มๆ ไป แล้วมีคนคนนึงอยากรู้จักไอ้ search engines หรือ บอกว่า อาจารย์ให้งานมา ให้ไปค้นในอินเตอร์เน็ตต้องทำงัย ทำไม่เป็นเลย แล้วให้ผมอธิบายให้เขาฟังว่ามันคืออะไร แล้วผมไปอธิบายอย่างนี้เข้า ก็อาจจะเอวัง เพราะคงไม่รู้เรื่องไม่เข้าใจ วิธีอื่นๆ ที่เราจะทำให้เขาเข้าใจมากขึ้นว่า ของนั้นคืออะไร ก็อาจจะสาธิตให้ดู ว่ามันใช้ยังงัย โดยไม่ต้องเข้าใจว่าหลักการ ความหมายมันคืออะไร หรือ ยกตัวอย่าง ว่าอะไรที่อยู่ในข่าย ของของสิ่งนั้นบ้าง ถ้าเขาลองเข้าไปใช้ หรือ เคยใช้ ก็คงจะพอนึกออก หรือ เข้าใจได้ว่าอะไรมันคืออะไรมากขึ้น ซึ่งรายการของ search engines ที่มีอยู่ล้านเจ็ดสิบเอ็ดแสน จะมาเล่าในครั้งต่อไป แต่เอาเป็นว่า ไอ้นิยามข้างต้น ถ้าสำหรับ Technomania ทั้งหลาย ก็คงไม่เดือดร้อนจะเข้าใจ แต่สำหรับ ตาสีตาสา ก็คงไม่อยากเข้าใจ

ผมลองอธิบายแบบฮาวทูดู ว่า สมมติว่า คุณมีตารางข้อมูล หรือ ข้อมูลอะไรก็ตาม แล้วบังเอิญคุณจะต้องค้นหาอะไรบางอย่าง จินตนาการว่า ถ้ามันเก็บไว้เป็นกระดาษ แฟ้มต่างๆ เนี่ย เวลาเราจะหา เราก็อาจจะต้องรื้อ อ่าน ไล่กันแทบลมจับ ถ้าไม่มีระบบจัดเก็บ และระบบ retrieve ที่ดี แต่ถ้าเรามี แท็ก มีการจัดแบบเป็นระเบียบ มี archive ที่เป็นระบบ เรียงตามนั้นนี้ ให้ดี เราก็พอจะเข้าถึงข้อมูลที่ต้องการได้สะดวกขึ้น แต่ถ้าข้อมูลมีมาก ก็ยังไม่จัดว่าสะดวกนัก เราก็เลยเก็บข้อมูลในคอมพิวเตอร์ แล้วก็ต้องมีไอ้เครื่องมือ หรือ จริงๆ ก็คือ โปรแกรมคอมพิวเตอร์ น่ะแหละ ไม่ได้มีหน้าตาเป็นเครื่องจักรกล นาวิเกเตอร์ อะไรทั้งนั้น ที่สามารถจะบอกมันว่า ฉันจะหาข้อมูลนี้ นั่น โน่น นะ แล้วมันก็ตรงเข้าไปหาข้อมูล ออกมาให้เรา โดยเราก็ต้องใส่คำ หรือ จะเรียกว่าคำสั่ง หรือ อินพุต หรือ คำสำคัญ หรือ อะไรทำนองนี้ เข้าไป แล้วมันก็ออกมา ด้วยความที่มันเป็นคอมพิวเตอร์ มันก็เลยรวดเร็วและสะดวกสบายหายกังวล แต่ทั้งนี้ทั้งนั้น มันเป็นคอมพิวเตอร์ มันก็คงไม่รู้หรอกว่า มันหาอะไรมาให้เรา บางครั้ง เราอ่านๆ ไป มันก็ไม่เกี่ยวกับสิ่งที่เราอยากจะหา เรียกได้ว่า ข้อมูลขยะ เราก็เลยต้องมีวิธีจัดการข้อมูลให้ถูกจริตกับเครื่องมือค้นหาด้วย ถึงจะทำให้ได้สิ่งที่เราอยากจะได้ มันก็ต้องมีระบบนิดหน่อย เหมือนกับเอกสาร ข้อมูลที่อยู่ในเชิงกระดาษด้วย ทีนี้คอมพิวเตอร์ตั้งโต๊ะ วางตักที่เรามีอยู่ ก็มีโปรแกรมนี้ติดมาเสมอ เราจะค้นหาไฟล์ หาข้อมูล ก็เข้าไปหาได้ แต่ถ้าเราใส่ชื่อไฟล์ไม่ดี จัดเก็บแบ่งโฟลเดอร์ไม่ดี เราก็อาจจะหาไม่เจออยู่ดี

หรือ ฐานข้อมูลในหน่วยงานหรือองค์กร ก็เช่นเดียวกัน ก็ต้องมีวิธีค้นหาข้อมูลที่เราต้องการออกมา ก็ใช้ไอ้เครื่องมือนี่แหละ หาเอา

ครั้นพอมีอินเตอร์เน็ต และข้อมูล หรือ ฐานข้อมูลมันมากล้นมหาศาล ก็ต้องมี  เครื่องมือที่เปี่ยมประสิทธิภาพในการหาข้อมูลที่เราต้องการให้ได้ออกมา ไม่ได้เป็นข้อมูลขยะ ที่ไม่มีประโยชน์ ก็เลยมีการพัฒนาเครื่องมือโปรแกรมนี้ จนทำให้เรารู้จักลุงกู๋ อากู๋ กูเกิ้ล คุณย่า ย๊าฮู หรือ อิบิงซึ่งออกมาทำด๊องอะไรผมก็ไม่ทราบ ไม่ค่อยจะโปรด แต่เดี๋ยวค่อยมาว่าแต่ละตัวกันในคราวต่อๆไป แต่ตอนนี้อยากให้เห็นภาพคร่าว ว่า Search Engines ก็คือโปรแกรมคอมพิวเตอร์ บางอย่าง ที่ทำหน้าที่ แทนเราหรือหน้าที่ที่เราทำไม่ได้ ในการงัดข้อมูลที่เราต้องการออกมาจากมหาสมุทรข้อมูลนั่นเอง และทีเรารู้จักคำนี้กันนี้ในทศวรรษนี้ก็เพราะ Search Engines ทีอิงกับเว็บ หรือ เรียกว่า Web Search Engines  นั่นเอง

Friday, August 5, 2011

เริ่มเรื่องเครื่องมือค้นหาทางอินเตอร์เน็ต สองทศวรรษการเปลี่ยนแปลงของมนุษยชาติ

15  ปีที่แล้ว กูเกิ้ลได้ถือกำเนิดขึ้นเพื่อให้คนทั่วไปได้เข้าใช้ และเพื่อประโยชน์ทางธุรกิจของบริษัท เป็นเครื่องมื้อค้นหาทางอินเตอร์เน็ตหรือ Search Engines ในตอนนั้นมี Search Engines อื่นที่เป็นที่รู้จักกันคือ Yahoo ส่วนอันอื่นยังไม่เป็นที่รู้จักกันทั่วไป อาจจะเพราะ Internets หรือ World Wide Web ก็ยังไม่ได้รู้จักกันแพร่หลายนอกประเทศสหรัฐอเมริกา มากนัก แต่เวลาผ่านไป หนึ่งทศวรรษ กูเกิ้ล Google ได้กลายเป็นเครื่องมือค้นหาที่ได้รับความนิยมสูงสุด มีคนคลิกเข้าไปเพื่อหาข้อมูลจากกูเกิ้ลทั่วโลกเป็นล้านล้านครั้ง ในขณะที่เจ้าอื่นที่อาจจะยืนหยัดอยู่ได้ก็มี ยาฮู แต่ก็เปลี่ยนโฉมไปพอสมควร MSN ได้ส่ง Bing ออกมาในช่วงไม่นานมานี้ ซึ่งคงต้องดูบทบาทมันต่อไป เครื่องมือค้นหาเหล่านี้ได้เปลี่ยนแปลงโลกไปอย่างที่ไม่เคยมีมาก่อน รูปแบบการทำธุกิจ ธุรกรรมทางอินเตอร์เน็ต และการโฆษณา การศึกษา และ เข้าถึงแหล่งความรู้ของมนุษยชาติ การติดต่อสื่อสาร และอื่น ๆ รวมทั้งผลกระทบด้านลบ เช่น การจารกรรมข้อมูล การเผยแพร่ข่าว เพื่อทำลายและดิสเครดิต หรือ อะไรที่เราแทบจะไม่คาดคิด ราวกับสำนวนไทย ว่า ไฟลามทุ่ง คือ ยากที่จะหยุดยั้ง อย่างที่ไม่น่าจะมีเทคโนโลยีหรือการคิดค้นใด มีผลกระทบมากมายขนาดนี้ ผมเขียนบล็อกนี้ขึ้นมา เพื่อรวบรวมเรื่องราวของเครื่องมืออันทรงประสิทธิภาพในทุกแง่มุมเท่าที่ผมจะสามารถคิดและนึกถึงได้ และหาข้อมูลมาเล่าสู่กันฟังในเชิงปกิณกะได้ หวังว่าจะได้ประโยชน์และเพลิดเพลินไม่มากก็น้อย