Some quick notes on OCR. Revisiting my DjVu viewer experiments it really struck me how "dirty" the OCR text is. It's readable, but if we were to display the OCR text rather than the images, it would be a little offputting.
Some quick notes on OCR. Revisiting my DjVu viewer experiments it really struck me how "dirty" the OCR text is. It's readable, but if we were to display the OCR text rather than the images, it would be a little offputting.
In this previous blog post I wrote about one way in which we have enhanced the journal article. Associated with that enhancement, and also sprinkled liberally throughout this blog, are links to a Digital Repository (if you want to read all about it, see DOI: 10.1021/ci7004737). It is a fairly specific repository for chemistry, with about 5000 entries.
Scientists write blogs for a variety of reasons. But these do probably not include getting tenure (or grants). For that one has to publish.
Das Bundesinnenministerium hat die Webseite E-Konsulation.de gestartet, auf der Bürger direkt im Internet zur Netzpolitik Stellung nehmen können. Die deutschen Verleger beschweren sich beim Bundeskartellamt, Google würde sich selbst und seine Geschäftspartner in seinen Suchergebnissen bevorzugen. Das und mehr im Telemedicus-Wochenrückblick.
Die Podiumsdiskussion in in der Heinrich-Böll-Stiftung in Berlin war heute abend ein voller Erfolg – sie musste in den großen Saal verlegt worden, da das Zuschauerinteresse so groß war. Es ging um das Thema Leistungsschutzrecht für Presseverlage, moderiert und (mit-)organisiert von Matthias Spielkamp von iRights.info. Wer sich einlesen möchte: Auf der Ankündigungsseite für die Veranstaltung gibt es jeden Menge Links zu Texten und Gutachten.
In den letzten Monaten begann es erst leise, dann immer lauter, das Wispern, das Tuscheln und schließlich die öffentlich vorgebrachte Forderung nach einem Leistungsschutzrecht für Verlage. Eine alte Forderung wieder ausgepackt und prominent vorgebracht. Ganz vorne dran: die Presseverlage. Doch was verbirgt sich dahinter? Wie ist diese Forderung einzuordnen?
Im undurchdringlichen Dschungel der Debatten um Urheberrechte, neue Verdienstmöglichkeiten im Internet und den Schutz ,,geistigen Eigentums“ wurde Anfang 2009 eine vergessen geglaubte Spezies wiederentdeckt: das Leistungsschutzrecht für Verleger. Erstaunlich, wie viel über dieses mysteriöse Wesen seitdem bereits geschrieben, diskutiert und was hierzu schon alles gefordert wurde.
Im Zusammenhang mit der Tagung am 2. Oktober „Infotopia oder die Zukunft des Wissens“, die iRights.info zusammen mit der Heinrich-Böll-Stiftung und dem Goethe-Institut ausrichtet, hat iRights.info nun eine Liste von häufigen Fragen erarbeitet, die hoffentlich alle offenen Fragen zu Google Books beantwortet. Jedenfalls die häufigeren. Dazu gehören zum Beispiel: Was ist das Google Books Settlement? Wie funktioniert eine Class Action-Klage?
Andrew Su has posted an analysis of Gene Wiki, a project to provide Wikipedia pages on every human gene: This result is interesting in that an existing resource (Gene Cards) beats Wikipedia, but only just.
Given that one response to my post on Fungi in Wikipedia was to say that fungi are also charismatic, so maybe I should try [insert unsexy taxon name here]. So, I've now looked at all the species I extracted from Wikipedia (nearly 72,000), ran the Google searches, and here are the results: Site How many times is it the top hit?