Wednesday, December 6, 2006

วิชา Google : Information Retrieval ที่วิศวะฯคอมฯ ม.เกษตร

ปี 2549 ที่ภาควิชาคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเกษตรศาสตร์ เทอมปลายนี้ มีวิชา Selected Topic in Computer Engineering ครับ วิชานี้ภาควิชาจะให้ อ. ในภาค เปิดวิชาอะไรก็ได้ที่เป็นที่สนใจในวิศวกรรมคอมพิวเตอร์ เทอมนี้นี่เอง Topic ที่ถูกเลือกขึ้นมาเป็นของ อ.อานนท์ แห่ง lab Mike (Massive information & knowledge engineering) ซึ่งอยู่ในสาขา Information Retrieval ซึ่งเป็นสาขาหนึ่งที่พัฒนา Search Engine ด้วยนั่นเอง

และหัวข้อก็คือ "Google : What's behind the scene" หรือเบื้องหลังของ Google ในวิชานี้จะพูดถึงทฤษฎี แนวทาง การพัฒนา Search Engine และยังต้องลงมือปฏิบัติทำกันจริงๆอีกด้วย กลุ่มของพวกเรา newSpoke มีโอกาสได้ร่วม class วิชานี้เช่นกัน เห็นว่าเป็นวิชาที่เข้ากับการพัฒนา newSpoke เลยถือโอกาสเอาภาพบรรยากาศของการเรียนวิชานี้มาให้ดูนะครับ

เหตุเกิดที่ตึกภาควิชาคอมพิวเตอร์นะครับ ทุกวันอังคาร เวลาบ่ายโมงถึงบ่ายสี่ เรามีนัดกันที่ห้อง 203 หึๆๆ... วิชานี้ Lecture ไปเพียง 4 ครั้ง เนื้อหาก็มี ระบบการทำงานของ Web Crawler , Search Engine, Updater โดยรวม Model ที่ใช้แทนเอกสารต่างๆ ทั้งในรูปของ Vector ฯลฯ ผ่านไปเพียงสี่ครั้งอาจารย์ก็จะให้นิสิตแบ่งกลุ่มกันทำโปรเจคกันเลยครับ โดยโปรเจคที่แต่ละกลุ่มทำก็จะหลากหลาย เกี่ยวกับหลายๆด้านของ Information Retrieval ไปนะครับ

แต่ละกลุ่มจะมีพี่เลี้ยงเป็นนิสิต ป.โท-เอก ช่วยดูแลด้วยโดยพี่คนไหนทำวิจัยเรื่องที่ใกล้เคียงกับโปรเจคก็จะได้พี่คนนั้นมาเป็นที่ปรึกษา พี่เค้าจะมี CheckPoint นัดเราตรวจงานทุกสัปดาห์ เอา Research มาให้อ่าน เตรียมโปรแกรมและเครื่องมือให้ ฯลฯ

สัปดาห์นี้เป้นสัปดาห์ Present ความคืบหน้าครั้งที่ 1 มี อ. และ พี่ป.โท-เอก มาช่วยดูทุกกลุ่มเพื่อตรวจสอบ ติชม ให้คำแนะนำ


โปรเจคที่ให้ทำก็เป็น เรื่องที่หลากหลายในสาขา IR แต่ทุกเรื่องล้วนเกี่ยวข้องกับ Search Engine ทั้งนั้นครับ เช่น โครงการ
- RedBin : Where Search Engine meet humanity imagination
เป็นโครงการพัฒนา Search Engine ภาษาไทย ที่ใช้ระบบ PageRank เหมือน Google และยังมีการทำ Web Graph เพื่อใช้สอดส่องดูแลจัดการระบบข้อมูลและ Spider อีกด้วย
- Search Result Clustering : เป็นโครงการทำ Vertical Search Engine ซึ่งกำลังเป็นที่จับตามองกันอยู่ในขณะนี้ครับ
ตัวอย่าง Vertical Search Engine ของต่างประเทศ ดูได้ที่
http://www.vivisimo.com
- Meta Search Engine : เป็นโครงการนำ Search Result ของ Engine หลายๆที่มารวมกันแล้วจัดอันดับใหม่
ตัวอย่าง Meta Search Engine ของต่างประเทศ ดูได้ที่
http://www.dogpile.com
- Scalable Web Crawler : เป็นโครงการพัฒนา Spider ที่ทำงานบน PC หลายๆเครื่องพร้อมกันได้ โดยเน้นความสามารถที่จำนวนเครื่อง PC ที่ใช้สามารถเพิ่มลด ได้โดยไม่กระทบต่อ Spider ที่ทำงานอยู่
- Web Change Detection : เป็นโครงการพัฒนาเครื่องมือประมาณระยะเวลาว่า เว็บเพจใดอัพเดทเวลาไหน (จะได้ตามไปสั่งให้ Spider เก็บมาถูก)
- Specific Search : เป็นโครงการพัฒนา Search Engine ที่เจาะจงเฉพาะเรื่อง เช่น เอกสารคอมพิวเตอร์ หรือ งานวิจัยเป็นต้น
- TrustRank : เป็นโครงการพัฒนาวิธีการให้คะแนนเว็บไซต์ว่า ไซต์ไหนเป็น Spam หรือไม่
- PageRank : เป็นโครงการพัฒนาวิธีการให้คะแนนเว็บไซต์ว่า ไซต์ไหนเป็นที่นิยม
ฯลฯ อีกครับ (จำมาไม่หมด) แต่ทุกโครงการเหล่านี้ต้องพัฒนาจริงและประเมินผลได้ ตามเกณฑ์การทำวิจัยครับ

เป็นอีกวิชาหนึ่งที่น่าสนใจใช่มั่ยครับ? หากใครสนใจลองหาโอกาส add ดูนะครับ อิอิ...
ไว้จะเอาเรื่องราวใน Class นี้มาฝากอีกนะครับ