Thursday, November 8, 2007

BaamBoo: “Chúng tôi chỉ là công cụ tìm kiếm”


Baamboo hay Google, Yahoo search chỉ là những công cụ tìm kiếm chứ không phải công cụ xuất bản nội dung

Sau 6 tháng phát triển, website này đã đạt đến vị trí 37 trong top 100 trang web hàng đầu Việt Nam, theo thống kê của Alexa. Ông Nguyễn Thế Tân, trưởng nhóm phát triển BaamBoo.com đã chia sẻ những suy nghĩ về những khó khăn trong việc phát triển sản phẩm công nghệ ở Việt Nam.

BaamBoo có cung cấp nội dung xấu không, thưa ông?

Chúng tôi khẳng định BaamBoo không cung cấp nội dung xấu. Bản chất BaamBoo là công cụ tìm kiếm, người sử dụng Internet dùng BaamBoo để tìm kiếm ra tài nguyên trên Internet (cụ thể trong trường hợp này là Video), sau đó xem thông tin trên các trang web được tìm thấy. Dù bạn search bằng YouTube, Google, BaamBoo hay các máy tìm kiếm khác thì bạn cũng sẽ tìm thấy các video này mà thôi.

Ngay bây giờ, nếu bạn mở Google ra và tìm kiếm thì bạn cũng sẽ có thể tìm ra hàng triệu nội dung xấu. Thậm chí, nếu tìm trên BaamBoo bạn sẽ tìm thấy ít nội dung ngoài ý muốn hơn trên YouTube hay Google Video, lý do là ngay từ lúc bắt đầu phát triển bản Alpha chúng tôi đã ý thức điều này và sử dụng các “bộ lọc” để lọc bớt các nội dung xấu. Hy vọng bộ lọc này sẽ sớm hoàn hiện để lọc hết các nội dung không phù hợp với văn hóa Việt Nam.

Nói BaamBoo tiếp tay cho nội dung xấu cũng như nói người bán kìm tiếp tay cho kẻ phá khóa chỉ vì hắn dùng chiếc kìm người đó bán cho để phá cửa nhà người khác, Google, Yahoo 360 tiếp tay cho sex và lối sống xấu vì có một vài blog bẩn, Internet tiếp tay cho kẻ ăn cắp thẻ tín dụng và phản động chỉ vì trên đó có phản động.

Trên Internet có vô vàn thông tin tốt, số lượng thông tin xấu chỉ là phần nhỏ. Nếu không nhắc tới việc BaamBoo giúp bạn đọc tìm ra các nội dung tốt, mà chỉ nhắc tới một thiểu số các nội dung xấu thì phần nào BaamBoo phải chịu “tiếng oan”.

Ông nghĩ thế nào về trách nhiệm cản trở nội dung xấu

Đầu tiên chúng tôi công dân nước Việt Nam và ngay từ lúc bắt đầu phát triển BaamBoo đã luôn luôn ý thức về vấn đề này, vì vậy ngay từ giai đoạn thử nghiệm, chúng tôi đã chú trọng phát triển các bộ lọc nội dung.

Tuy vậy, công cụ tìm kiếm chỉ là công cụ kỹ thuật, không công cụ nào đủ sức một mình cản trở nội dung xấu. Việc này cần có sự tham gia của các ISP, từ chính các trang web cung cấp nội dung, các công cụ tìm kiếm, công cụ chia sẻ, báo chí và ngay từ chính người dùng.

Trong sự việc này chúng tôi rất lấy làm tiếc là bạn đọc đó và báo Người Lao Động khi tìm thấy nội dung xấu đã không liên hệ với BaamBoo để chúng tôi có thể loại bỏ nội dung này ra khỏi hệ thống, trước khi hàng triệu bạn đọc qua báo Người Lao Động có thể tìm thấy chúng.

Ông có nhắc nhiều tới bộ lọc, vậy các ông phát triển bộ lọc như thế nào?

Chúng tôi sử dụng song song nhiều phương pháp, kết hợp thủ công lẫn với công nghệ. Thứ nhất, chúng tôi dùng một bộ lọc tự động, ngăn chặn các từ khóa xấu. Ở giai đoạn này bộ lọc vẫn còn đơn giản, nhưng hiện nay chúng tôi đang hợp tác với nhiều chuyên gia nhằm phát triển các bộ lọc thông minh, biết cách “tự học” để hoàn thiện theo thời gian.

Thứ hai, trên BaamBoo chúng tôi luôn có nút “Báo nội dung xấu”, độc giả thấy thông tin xấu chỉ cần bấm vào nút này để loại chúng khỏi kết quả tìm kiếm của BaamBoo. Thứ ba, chúng tôi tổ chức một đội ngũ thường xuyên trực thông tin, chuyên theo dõi, phát hiện là gạt các thông tin xấu ra khỏi hệ thống.

Nút cảnh báo video xấu

Sự kết hợp giữa 3 phương pháp này giúp chúng tôi giải quyết được phần nào vấn đề bộ lọc. Công nghệ cao và sự hỗ trợ của bạn đọc giúp tiết kiệm thời gian và chi phí, nhưng lực lượng trực lại đảm bảo sự tin cậy. Từ khi chạy đến giờ, BaamBoo đã loại bỏ khỏi hệ thống khoảng 10.000 nội dung không phù hợp.

Youtube và Google có bộ lọc không, hay chỉ mình BaamBoo có?

Youtube và Google đều có bộ lọc, họ áp dụng nhiều công nghệ tiên tiến - có thể nói là vượt xa bộ lọc của BaamBoo. Họ lọc bỏ các thông tin về sex, phát xít và các hành vi xấu khác. Tuy vậy do định nghĩa của họ về xấu khác với chúng ta họ không lọc được một số nội dung mà Việt Nam coi là xấu.

Với BaamBoo, chúng tôi “đứng trên vai người khổng lồ” với bộ lọc 2 lớp. Lớp thứ nhất sử dụng bộ lọc của chính YouTube, Google để loại bỏ các nội dung xấu chung của thế giới, tiếp đó sử dụng bộ lọc riêng của BaamBoo để lọc bỏ tiếp các nội dung xấu đặc thù cho Việt Nam.

Ông đánh giá thế nào về bài báo của Người Lao Động?

Chúng tôi rất cảm ơn báo Người Lao Động, nhờ bài báo này mà chúng tôi càng hiểu hơn là công cụ bộ lọc của mình chưa hoàn thiện, cần đầu tư công sức hơn nữa. Phần nào bài báo này cũng giúp chúng tôi khẳng định chủ trương đầu tư vào bộ lọc của chúng tôi là hợp lý.

Về mặt hành động, chúng tôi đã có những biện pháp tức thời để phản ứng với tình huống này. Ngay lúc này, nếu bạn vào BaamBoo.com để tìm thì sẽ không còn thấy video kia nữa, vì chúng tôi đã loại bỏ nó khỏi kết quả tìm kiếm. Ngoài ra, chúng tôi đã tăng cường ngay đội trực nội dung, làm việc tăng ca trong mấy ngày tiếp tới nhằm tìm kiếm, theo dõi là loại bỏ nội dung xấu khỏi kết quả tìm kiếm. Chúng tôi cam kết sẽ đầu tư nhiều hơn để BaamBoo có được bộ lọc tốt hơn.

Để giúp BaamBoo, bạn hãy bấm vào nút “Báo nội dung xấu” mỗi khi bạn tìm thấy video xấu.

Ông hình dung thế nào về tương lai của máy tìm kiếm Việt Nam, tầm quan trọng của nó với thông tin và nhân loại?

Tôi tin tưởng rằng chỉ có máy tìm kiếm Việt Nam mới có khả năng phục vụ được các nhu cầu đặc thù của Việt Nam, trong đó bộ lọc là một ví dụ. Còn nhiều nội dung mà các máy tìm kiếm quốc tế không thể tìm kiếm được ví dụ như địa điểm du lịch, máy ATM của VCB đặt ở đâu, điện thoại một công ty Việt Nam, thông tin tri thức Việt Nam, các thông tin pháp luật, giáo dục và nhiều nội dung khác nữa.

Vai trò của máy tìm kiếm với nhân loại nói chung và Việt Nam nói riêng đã được khẳng định: nó giúp chúng ta tìm thấy và tiếp cận với thông tin tri thức. Với Việt Nam, khi mà chúng ta bị tụt hậu về mọi mặt, chúng tôi luôn mơ ước phát triển BaamBoo thành một máy tìm kiếm vì người Việt giúp người Việt tiếp cận tốt hơn với các thông tin đặc thù của Việt Nam.

Phải thừa nhận đây là một việc làm rất khó khăn, chúng tôi vẫn nói đùa với nhau xác suất thất bại là 95%, nhưng chỉ cần còn 5% chúng ta vẫn quyết tâm thực hiện.

Sắp tới Baamboo sẽ đưa ra các dịch vụ gì?

Trong 1-2 tháng tới, chúng tôi sẽ tiếp tục đưa ra một loạt sản phẩm liên quan tới tìm kiếm, tuy vậy chúng tôi muốn hoàn thiện công nghệ, nội dung, kỹ thuật trước khi công bố ra công chúng. Có lẽ tốt hơn là để sản phẩm và người sử dụng trả lời.

Trong quá trình phát triển, chắc chắn sẽ còn nhiều thiếu sót, chúng tôi hy vọng công luận sẽ cảm thông hơn trước những sự cố như vừa rồi và hợp tác tạo điều kiện cho chúng tôi cũng như các máy tìm kiếm Việt Nam phát triển. Nếu chỉ vì một số nội dung không phù hợp mà chúng ta chặn đường phát triển của công nghệ thì chỉ trong vài năm các máy tìm kiếm của thế giới sẽ thống trị con đường tiếp cận thông tin và văn hóa Việt Nam.

Trí Thàn

No comments: