Unixtopia

main/ artigos/

Wikidata

É um grande projeto colaborativo irmão da Wikipedia, hospedado pela Wikimedia Foundation, para criar um enorme banco de dados de domínio público não comercial contendo informações basicamente sobre tudo. Não tudo, há algumas regras sobre o que pode ser incluído que são semelhantes às da Wikipedia, notabilidade, você não pode adicionar a si mesmo a menos que seja notável o suficiente, é claro que você não pode adicionar dados ilegais. O Wikidata registra dados em uma forma do chamado gráfico de conhecimento, ele conecta itens e suas propriedades com declarações como Terra:localização:Sistema Solar interno, criando uma estrutura matemática chamada gráfico. O banco de dados inteiro está disponível para qualquer pessoa para qualquer propósito sem quaisquer condições, sob CC0. O Wikidata éútil e um pouco injustamente esquecido na sombra de sua irmã gigante Wikipedia, embora ofereça uma maneira de obter facilmente grandes conjuntos de dados de domínio público absolutamente gratuitos sobre qualquer coisa. O banco de dados pode ser consultado com linguagens especializadas para que se possa obter, como coordenadas de todos os ataques terroristas que aconteceram em um determinado período de tempo, uma lista de gatos famosos, árvore de espécies biológicas ou listar judeus que administram restaurantes na Ásia ou qualquer outra coisa maluca. O Wikidata muitas vezes contém informações extras que não estão presentes no artigo da Wikipédia sobre o item e que nem são encontradas rapidamente no Google, e as informações às vezessão apoiadas por fontes, assim como na Wikipédia, então é bom sempre verificar o Wikidata ao pesquisar qualquer coisa. O Wikidata foi aberto em 30 de outubro de 2012. Os primeiros dados armazenados foram links entre versões de artigos da Wikipédia em diferentes idiomas, mais tarde a Wikipédia começou a usar o Wikidata para armazenar informações para exibir infoboxes em artigos e assim o Wikidata cresceu e eventualmente se tornou um banco de dados próprio. Em 2022, havia pouco mais de 100 milhões de itens, mais de 1 bilhão de declarações e mais de 20.000 usuários ativos.

Estrutura do banco de dados

O banco de dados é um gráfico de conhecimento. Ele armazena os seguintes tipos de registros:

As propriedades mais importantes são provavelmente instância de P31 e subclasse de P279 que colocam itens em conjuntos e estabelecem subconjuntos. A instância do atributo diz que o item é uma manifestação individual de uma certa classe, note que um item pode ser uma instância de várias classes ao mesmo tempo. A subclasse do atributo diz que uma certa classe é uma subclasse de outra, dog é uma subclasse de pet que é ainda uma subclasse de animal doméstico. Note também que um item pode ser uma instância e uma classe.

Como fazer

Há muitas bibliotecas e APIs para wikidata que você pode usar, diferente de corporações de merda que guardam seus dados à força, o wikidata fornece dados de maneiras amigáveis, você pode até baixar todo o banco de dados wikidata no formato JSON, cerca de 100 GB. A maneira mais fácil de recuperar apenas os dados nos quais você está interessado é provavelmente ir para a interface de query.wikidata.org, inserir uma consulta, na linguagem SPARQL, semelhante ao SQL, e clicar em baixar dados, você pode escolher vários formatos, com o JSON e CSV. Isso pode ser processado posteriormente com qualquer linguagem ou ferramenta como Python ou LibreOffice Calc. A consulta que você insere pode facilmente levar muito tempo para ser executada e expirar, você precisa escrevê-la bem, o que para consultas mais complexas pode ser difícil se você não estiver familiarizado com SPARQL. Mas wikidata oferece dicas online sobre otimização de consultas e há exemplos na interface online que você pode modificar para adequar a você.

Aqui está uma consulta que seleciona videogames do gênero FPS:

SELECT ?item ?itemLabel WHERE 
{
  ?item wdt:P31 wd:Q7889.    # Item is video game and
  ?item wdt:P136 wd:Q185029. # Item é um fps FPS
  
  # this gets the item label:
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}
LIMIT 100 # limit to 100 results, make the query faster

Outra consulta que seleciona buracos negros junto com sua massa quando conhecida:

SELECT ?item ?itemLabel ?mass WHERE
{
  { ?item wdt:P31 wd:Q589. } # instances of black hole
  UNION
  { ?item wdt:P31 ?class. # instance of black hole subclass (e.g. supermassive blackhole, ...) 
    ?class wdt:P279 wd:Q589. }

  OPTIONAL { ?item wdt:P2067 ?mass }
  
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
}

Impulsionado por nada. Todo conteúdo é disponível sob CC0 1.0 domínio público. Envie comentários e correções para Mr. Unix em victor_hermian@disroot.org.