Wikidata
O Wikidata é um projeto da Fundação Wikimedia que visa fornecer uma base de dados editada colaborativamente para oferecer suporte para projetos tais como a Wikipédia. O Wikidata foi lançado em 30 de outubro de 2012. O projeto foi iniciado pela Wikimedia Deutschland e pretender fornecer uma origem comum de certos tipos de dados, como por exemplo, datas de nascimento, uma classe de dados validados, que possa ser utilizada pelos projetos da Wikimedia operando de forma similar ao funcionamento do Wikimedia Commons para imagens e outros tipos de mídia. Este foi o primeiro novo projeto da Wikimedia Foundation desde 2006.
O Wikidata é um banco de dados orientado a documentos, com foco em itens que representam qualquer tipo de tópico, conceito ou objeto. Cada item recebe um identificador persistente único chamado de seu QID, um número inteiro positivo prefixado com a letra maiúscula "Q"[a]. Com isso, é possível fazer traduções das informações básicas que descrevem o tópico que cada item abrange, sem privilegiar nenhum idioma específico. Exemplos de itens e seus QIDs: Jogos Olímpicos de Verão de 1988 (Q8470), amor (Q316), Johnny Cash (Q42775), Elvis Presley (Q303) e Gorila (Q36611). Os rótulos dos itens não precisam ser exclusivos. Por exemplo, existem dois itens chamados "Elvis Presley": Elvis Presley (Q303), que representa o cantor e ator americano, e Elvis Presley (Q610926), que representa seu álbum homônimo. No entanto, a combinação de um rótulo e sua descrição deve ser exclusiva. Para evitar ambiguidade, o QID de um item é vinculado a essa combinação.
Declarações
Declarações são como qualquer informação conhecida sobre um item é registrada no Wikidata. Formalmente, elas consistem em pares chave-valor, que correspondem a uma propriedade (como "autor" ou "data de publicação") com um ou mais valores de entidade (como " Sir Arthur Conan Doyle " ou "1902"). Por exemplo, a declaração informal em inglês "milk is white" (leite é branco, em tradução livre) seria codificada por uma declaração que emparelha a propriedade cor (P462) com o valor branco (Q23444) sob o item leite (Q8495). As declarações podem mapear uma propriedade para mais de um valor. Por exemplo, a propriedade "ocupação" de Marie Curie poderia ser vinculada aos valores "física" e "química", para refletir o fato de que ela se dedicava a ambas as ocupações.
Propriedades
Cada propriedade possui um identificador numérico prefixado com P maiúsculo e uma página no Wikidata com rótulo, descrição, aliases e instruções opcionais. Assim, existem propriedades com o único propósito de descrever outras propriedades, como subpropriedade de (P1647). Propriedades também podem definir regras mais complexas sobre seu uso pretendido, denominadas restrições. Por exemplo, a propriedade capital (P36) inclui uma "restrição de valor único", refletindo a realidade de que (tipicamente) territórios possuem apenas uma capital. Restrições são tratadas como alertas e dicas de teste, em vez de regras invioláveis. Para uma a criação de uma nova propriedade, é necessário um processo de discussão entre a comunidade.
Lexemas
Em linguística, um lexema é uma unidade de significado lexical que representa um grupo de palavras que compartilham o mesmo significado central e características gramaticais. Da mesma forma, os lexemas do Wikidata são itens com uma estrutura que os torna mais adequados para armazenar dados lexicográficos. Desde 2016, o Wikidata oferece suporte a entradas lexicográficas na forma de lexemas. No Wikidata, as entradas lexicográficas têm um identificador diferente das entradas de itens regulares. Essas entradas são prefixadas com a letra L, como nas entradas de exemplo para livro e vaca. As entradas lexicográficas no Wikidata podem conter declarações, sentidos e formas. O uso de entradas lexicográficas no Wikidata permite a documentação do uso de palavras, a conexão entre palavras e itens no Wikidata, traduções de palavras e ativa dados lexicográficos legíveis por máquina.
Esquemas de entidade
No Wikidata, um esquema é um modelo de dados que descreve os atributos necessários para um item de dados. Por exemplo, um item de dados que usa o atributo "instância de" com o valor "humano" normalmente incluiria atributos como "local de nascimento", "data de nascimento", "data de falecimento" e "local de falecimento". O esquema de entidade no Wikidata utiliza Shape Expression (ShEx) para descrever os dados em itens do Wikidata na forma de um Resource Description Framework (RDF). O uso de esquemas de entidade no Wikidata ajuda a resolver inconsistências de dados e vandalismo descontrolado. Janeiro de 2019 marcou o início do desenvolvimento de uma nova extensão para o MediaWiki, para permitir o armazenamento de ShEx em um namespace separado. Os esquemas de entidade são armazenados com identificadores diferentes daqueles usados para itens, propriedades e lexemas. Os esquemas de entidade são armazenados com um identificador "E", como E10 para o esquema de entidade de instâncias de dados humanos e E270 para o esquema de entidade de instâncias de dados de construção. Esta extensão foi instalada no Wikidata e permite que os contribuidores usem ShEx para validar e descrever dados do Resource Description Framework em itens e lexemas. Qualquer item ou lexema no Wikidata pode ser validado em relação a um esquema de entidade, e isso o torna uma ferramenta importante para garantia de qualidade.


