
Oxford University Press is a world-leader in providing online information to libraries and individuals worldwide. Constantly updated and expanded, our products include extensive databases, e-reference editions and over 200 Oxford journals across all interests and academic disciplines.
In this part of our laguage corpuses series we will introduce several projects, which are sometimes not corpuses in the true sense: WordNet is a large lexical database of English; Penn Treebank Project is an annotated corpus; UCREL (University Centre for Computer Corpus Research on Language) is a department at Lancaster University, which works on several different corpus projects.
V dnešním části seriálu o jazykových korpusech si představíme projekty, z nichž ne všechny jsou korpusy v pravém slova smyslu: WordNet je rozsáhlá lexikální databáze angličtiny; Penn Treebank Project je anotovaný korpus; UCREL (University Centre for Computer Corpus Research on Language) je katedra Lancasterské univerzity, na jejíž půdě se pracuje na několika různých (nejen) korpusových projektech.
There is a huge collection of e-resources available at Charles University in Prague. There are more then 18,700 e-journals in about 100 databases. Charles University in Prague is using the Ex Libris product suite for digital libraries to make e-resources easily available to all students and staff. The ERM system Verde is the central point for e-resources management. The OpenURL linkserver SFX connects users to available fulltexts anywhere and anytime they need it. The SFX server links users to fulltext in Google Scholar, e-journals AZ lists are automatically generated from the SFX knowledge base, and full MARC 21 e-journals records are imported from SFX to Aleph catalogue as well. Quick Search Journal HTML snippet is placed at Charles University SFX news blog and could be placed at any web page. SFX links users to full texts from Charles University MetaLib e-resources federative search engine too.
The Medical Subject Headings (MeSH) is a controlled vocabulary thesaurus produced by the National Library of Medicine (NLM), Bethesda, USA. MeSH is used for cataloging and searching biomedical and health-related information and documents for the MEDLINE®/PubMED® database and several other databases. The MeSH vocabulary is continually revised and updated. It is used by many national medical information centers all over the world. NLM has developed and implemented a concept centered vocabulary maintenance system for MeSH (MTMS) to help translators manage their work. The new structure support the implementation of MeSH in the UMLS Metathesaurus®, the multilingual database of controlled vocabularies and classifications.
The National Medical Library (NML), Prague, Czech Republic, has used MeSH since 1977. The Czech translation of MeSH is used by librarians at Czech medical center’s libraries. NML appreciated the possibility of using MTMS to mantain the Czech translation.
This database allows continual updating and managing the Czech translation in an easier manner. The process of translation means creation Czech terms as additional synonyms in a selected concept and dedicating one of these terms as the Czech preferred term.
Tezaurus Medical Subject Headings ( MeSH) je řízený slovník termínů z biomedicíny, vydávaný od r.1960 americkou Národní lékařskou knihovnou (U.S. National Library of Medicine, Bethesda - NLM).
MeSH je každý rok revidován a aktualizován a slouží pro zpracování a vyhledávání publikací a informací z oblasti lékařství a zdravotnictví. Je využíván v řadě lékařských center po celém světě a je překládán do mnoha jiných jazyků.
The contribution deals with possibilities of chemical formulas presentation on web site. It briefly characterizes the image, MathML and CML as well as web service application for this purpose. Paper specifies web service arrangement, its principle, functions and requirements. The concrete example illustrates its exploitation. Described web service is assigned to chemical formula conversion from standard ASCII form to HTML form that displays the atoms count or ions valence in form of subscripts or superscripts. Web service can be a part of other service or building component of other web application.
V súvislosti s prezentáciou chemických vzorcov minerálov na webových stránkach vznikla potreba riešiť ich správne zobrazenie. Týkalo sa to najmä problémov s indexovaním znakov kvantifikátorov vo vzorcoch. V rámci informačných systémov bývajú vzorce umiestnené v databázovej tabuľke ako textové konštanty zapísané v štandardnom ASCII tvare. Podobný problém sa vyskytuje aj v celom rade iných úloh a situácií, ktoré vedú k zobrazeniu vzorca na webovej stránke.
The article focuses on a centralized model of library system at Charles University which had to be developed as a necessity. It describes how it was built, which problems had to be solved and in what situation the catalog is in these days.
Univerzita Karlova v Praze jako největší a nejstarší vysoká škola v Česku má také nejvíce komplikované uspořádání, které vyplývá z historického vývoje této univerzity. Ani situace knihoven není právě jednoduchá, na Univerzitě Karlově neexistuje jedna centrální knihovna, ale každá fakulta (v některých případech dokonce ústav nebo institut) má knihovnu vlastní, která buduje svůj knihovní fond odděleně, a to v nejrůznějších lokacích nejen v Praze, ale i v Plzni a Hradci Králové.
The article introduces the American National Corpus. It describes goals of its authors, its scope and versions published so far. It also deals with its website and contains a summary of the covered facts.
Americký národní korpus (American National Corpus, ANC) je elektronická sbírka psaných a mluvených textů americké angličtiny [1]. Cílem projektu je poskytnout co nejkomplexnější obraz americké angličtiny, který by měl sloužit nejen pro lingvistiku, lexikografii, vývoj strojového porozumění jazyku (např. jazykový překlad a rešeršní software), kompilaci slovníků a tezaurů, ale také pro vzdělávání na všech úrovních.
Encyclopedia of Life (EOL) is a project funded by private grantmaking organizations, e.g., by the John D. and Catherine T. MacArthur Foundation and the Alfred P. Sloan Foundation. This resource will offer information and knowledge about the world’s species in one place and will accelerate understanding of the world’s biodiversity. At the moment first 30 000 pages of this encyclopedia are available. Pages will be created thanks to unique collaboration between scientists and the general public. By the year 2017 EOL will publish 1.8 million pages of known species of the world and establish a modern, functional, organized and highly valuable information resource for scientists, policymakers and anyone interested in the living world.
Projekt Encyklopedie života (Encyclopedia of Life, dále také EOL) plánuje do roku 2017 nabídnout na svých webových stránkách informace o všech biologických druzích žijících na planetě Zemi.
V současné chvíli encyklopedie nabízí:
The Musica Subject Gateway (MUS) provides integrated access to information resources in the field of music and musicology. The gateway is being created in the collaboration of the National Library of the Czech Republic and Charles University in Prague. Similar to other Czech subject gateways, it takes advantage of the MetaLib, SFX and Plone technologies. It enables parallel searching in specialized databases and library catalogues. The Quick Search menu is structured by the type of document (Sheet music, Sound recordings, Music literature, Web resources). It also includes a list of e-journals and a collection of web links which can also be searched using Conspectus categories. The SFX link server makes it easier to get a document or information related to it and/or its authors.
Oborová brána Musica (MUS) zaměřená na hudbu a hudební vědu vzniká v rámci projektu Koordinovaná tvorba oborových informačních bran ve spolupráci Národní knihovny České republiky a Univerzity Karlovy v Praze. Podobně jako sesterské brány KIV, ART a TECH navazuje MUS na Jednotnou informační bránu a využívá též stejných technologií (MetaLib, SFX, Plone).
This article from the laguage corpora series introduces three corpora of the Polish language: The IPI PAN Corpus, PWN Corpus of Polish and PELCRA Project.
Na poli polské korpusové lingvistiky není situace až tak jednoznačná, neboť v Polsku vzniká hned několik korpusů nezávisle na sobě (více viz ŠULC, 2002). My se zaměříme na tři poměrně velké a zajímavé polské korpusy.
Poslední komentáře
před 1 den 1 hod
před 1 týden 20 hod
před 1 týden 2 dny
před 1 týden 3 dny
před 4 týdny 2 dny
před 4 týdny 2 dny
před 5 týdnů 4 dny
před 6 týdnů 2 dny
před 6 týdnů 5 dnů
před 8 týdnů 3 dny