ContentMine: право добувати

Учасники проекту ContentMine за допомогою машин та фінансової підтримки Shuttleworth Foundation намагаються видобути 100 мільйонів фактів з наукової літератури. Творці проекту переконані, що «право на читання = право на добування», а тому кожен повинен мати право й на комп’ютерне опрацювання текстів. Подібні вольності потрібні насамперед для блага суспільства, щоб наукова інформація своєчасно опинялася у руках відповідних спеціалістів. На сайті проекту ContentMine вже доступні кілька корисних програмок, серед яких кравлери (збирають веб-адреси сторінок та файлів), скрапери (шукають у тенетах інформацію згідно заданих параметрів), конвертери (перетворюють файли одного формату в інший) та екстрактори зображень і даних. Дане програмне забезпечення поширюється під ліберальними ліцензіями MIT та Apache2, а відтак його можна вільно завантажувати, змінювати та удосконалювати.

Немає коментарів:

Дописати коментар