Webinsider

Redação, edição - Desenvolvimento - Usabilidade e AI

Usuários e software fazem a web semântica

11 de setembro de 2007, 21:18

Inicialmente projetada para ser compreendida apenas por seres humanos, a internet terá suas informações interpretadas também por máquinas, em um trabalho mais cooperativo entre usuários e agentes de software.

Por Fabiana Iglesias

Com Carlos Augusto Hentges*

Exercitar o pensamento voltado para o futuro exige o convívio com uma série de riscos. Um deles é próprio da futurologia: os eventos escapam da lógica prevista e atinge-se um resultado completamente diverso do esperado. Essa diversidade, porém, é parte imanente da função daqueles que tem na observação da tecnologia e seus desdobramentos o ponto de partida para a inovação.

Um exemplo muito claro dessa situação pode ser observado na trajetória da internet. Seus dez anos de existência comercial no Brasil foram comemorados em 2005. Antes, o uso era restrito, em maior parte, ao ambiente acadêmico.

Mais recentemente, a internet passou a ser associada ao termo 2.0. A “nova” rede, na verdade, é o resultado combinado de tecnologia de acesso à quantidade de usuários. Em uma simplificação grosseira dos desdobramentos provocados por mais de uma década de evolução, pode-se afirmar que o contingente de 1 bilhão de usuários freqüentes da internet atualmente, com conexões de melhor qualidade, avançou um passo no que diz respeito ao relacionamento com o conteúdo online. De espectador, passou a produtor.

Compartilhar essa informação não passa de um refinamento do quadro já estabelecido, portanto.

YouTube, MySpace e, em certa medida, o Orkut, para ficar apenas nas ferramentas mais populares, são a aplicação efetiva dos conceitos de produção compartilhada de conteúdo, próprios da internet 2.0.

Mas é claro que, em algum lugar, alguém está pensando em uma nova associação de idéias, que resultará em outra novidade nesse universo virtual tão amplo quando dinâmico. Bem, seu nome é internet 3.0, ou web semântica, e a idéia nem é tão nova assim. Tim Berners-Lee, o inglês que “inventou” a internet em 1990, é líder do World Wide Web Consortium (W3C), e um de seus grandes visionários.

No que consiste a web semântica? Trata-se de um conjunto de medidas que pretende criar significado, ou sentido, para tudo que habita a rede.

Por exemplo: você acessa uma ferramenta de busca online e faz uma pesquisa pelo termo “casa”. Vão surgir mais de 400 milhões de referências. Claro que é sua obrigação refinar a pesquisa. Ainda assim, a chance de haver muita informação que você não deseja é enorme. Isso acontece porque os programas de computador não são capazes de realizar a série de associações contextuais que são próprias da cognição humana.

Tornar a internet “inteligente”, e capaz de entender a essas necessidades, é o objetivo da web semântica. Em outras palavras, ela pretende que máquinas e seres humanos se comuniquem através de uma linguagem mais próxima.

E evolução consiste no fato de que a internet, inicialmente projetada para ser compreendida apenas por seres humanos, terá suas informações compreendidas também por máquinas. A estrutura semântica da informação deve levar a um trabalho mais cooperativo entre usuários e agentes de software.

Tentar prever o resultado disso, e mais ainda, sua aplicação comercial, leva aos riscos anotados no primeiro parágrafo. A observação do que vem ocorrendo com a internet 2.0, porém, fornece algumas pistas. O YouTube apenas há pouco tempo passou a receber a publicidade fundamental para sua capitalização. Outros nichos, como o Orkut, ainda estudam formas de adotar a prática sem que isso seja interpretado pelos usuários como uma invasão.

O sucesso da empreitada, nos parece, passa pela melhor interação do usuário com sua máquina pessoal, e desta com o universo da internet. O simples ato da compra de uma passagem aérea, no contexto da web semântica, implicaria na automática reserva de espaço em uma agenda virtual, o eventual direcionamento de e-mails para uma caixa previamente definida, e a alocação de arquivos importantes durante tal deslocamento para local próprio.

Outro exemplo possível, esse fornecido por Berners-Lee em The Semantic Web, trata de um serviço essencial: medicina. O usuário pede que o computador encontre um médico dentro de certos parâmetros – ele deve ser acadêmico e atender em um bairro próximo. Após navegar e encontrar algumas opções, o computador apresenta as opções de agenda do profissional escolhido. Basta ao usuário escolher o horário que lhe for mais conveniente e marcar a consulta.

O refinamento de funções como essa ainda está distante, mas são essenciais para que o conceito de web semântica se afirme, diferente do que aconteceu com tantas outras modas virtuais que ciclicamente surgiram na internet na última década. [Webinsider]

……………………………………….

* Carlos Hentges é redator web da e21 Digital, jornalista e publicitário.

.

Sobre o autor

Fabiana Iglesias (fabi.iglesias@gmail.com) é consultora de negócios web.

Apoio:

  • LayerDev Serviços de Webhosting Profissional

Palavras-chave relacionadas a este texto: [ programação ] [ buscadores ] [ TV, vídeo ]

Comentários

12 pessoas comentaram o artigo "Usuários e software fazem a web semântica"

Nelson Data: 12/09/2007 às 11:15 am

Atividade:

Cidade:

Acho que pecaram muito em fazer um artigo sobre Web Semântica e não fazer nenhuma referência a Microformats.

A definição sobre web 2.0 no começo esta muito boa, só que web semântica não é uma futura web 3.0. Web Semântica ja é realidade agora da web 2.0.

Nesta frase do artigo:
“No que consiste a web semântica? Trata-se de um conjunto de medidas que pretende criar significado, ou sentido, para tudo que habita a rede.”

Eu ja discordo desta afirmativa. Pelo oque eu conheço, Web Semântica é:
Processo de separar e refinar a informação definindo sua relevância por tags. Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.

Por exemplo: defini-se que titulos sempre serão na tag e texto será sempre dentro de . Na hora que o usuário buscar a informação, o robo de busca irá dar mais enfoque ao titulo e depois ao texto. Ou se vc procurar somente por titulo ele irá ler somente oque esta em e não se preocupará com o conteúdo dentro do .

E é por isso que Web Semãntica está ligada a Web Standards pois todo esse processo de refinamento e separação pode ser prejudicado com códigos sujos e javascript obstrutivo.

Nelson Data: 12/09/2007 às 6:12 pm

Atividade:

Cidade:

aff!

Agora que eu vi que as tags não apareceram no meu texto, vou refazer o trecho confuso:

Por exemplo: defini-se que titulos sempre serão na tag “h1″ e texto será sempre dentro de “p”. Na hora que o usuário buscar a informação, o robo de busca irá dar mais enfoque ao titulo e depois ao texto. Ou se vc procurar somente por titulo ele irá ler somente oque esta em “h1″ e não se preocupará com o conteúdo dentro do “p”.

Wladimir Data: 15/09/2007 às 1:36 pm

Atividade: Gestor de TI, Professor de ensino superior

Cidade: Fortaleza

Prezados,
penso que o artigo está bom para este fórum. As novidades para o ponto de vista do mercado geralmente já foram problemas estudados ou resolvidos na academia, há tempos.

Tive oportunidade de pesquisar sobre semantic web durante o mestrado e concordo que ainda há muito para a academia e a indústria resolver em relação a melhor composição de tecnologias (frameworks e padrões, como foi mencionado por um dos comentários).

Mas cabe acrescentar que as possibilidades da utilização da semantic web vão além da pesquisa com melhor precision e recall; busca-se uma atuação mais autônoma e inteligente dos programas de computador para que facilitem a vida de pessoas (físicas e jurídicas) em problemas considerados complexos, pelo volume de processamento X tempo de resposta X confiabilidade da resposta.

Diogo Santana Martins Data: 18/09/2007 às 10:46 am

Atividade: Mestrando em Ciência da Computação

Cidade: São Carlos - SP

Discordo do primeiro comentário. A Web Semântica não é “Processo de separar e refinar a informação definindo sua relevância por tags. Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.”. A Web Semântica busca, sim, atribuir significado (processável por máquinas) às informações da Web, usando-se tecnologias de representação de conhecimento que vêm há décadas sendo refinadas na comunidade de Inteligência Artificial.

Embora toda informação possua inerente semântica, as tecnologias correntes da Web só permitem que seu significado seja interpretado por seres humanos, pois como o autor do artigo muito bem coloca, “Isso acontece porque os programas de computador [ou mais precisamente, os programas que são capazes de processar informações semânticas] não são capazes de realizar a série de associações contextuais que são próprias da cognição humana”. Para que os programas possam apresentar um comportamento minimamente parecido com o processo cognitivo característico dos humanos, torna-se necessário representar formalmente o conhecimento presente nos conteúdos Web; ou seja, fornecer metadados que sejam semanticamente interpretáveis por máquinas.

“Tags” têm recebido grande atenção nos últimos tempos e é uma das forças alavancadoras da Web 2.0. Embora esse movimento tenha contribuído bastante para a evolução da Web, não se pode confundí-lo com os objetivos mais ambiciosos da Web Semântica (cujo sinônimo recentemente cunhado é Web 3.0). As tags nada mais são que vocabulários criados pelos usuários e cujo aproveitamento se dá pelo uso de “folksonomias”, que por sua vez permitem estabelecer relações entre objetos de conteúdo e usuários. Isso nada mais é do que uma forma de aproveitamento de redes sociais que se formam ao redor de uma base de conteúdos (como Flickr, YouTube, Delicious, etc.) e da exploração do “inteligência coletiva” que emerge desses cenários.Já a Web Semântica não se fundamenta na mera atribuição de “tags”, mas na atribuição de metadados formal e logicamente representados, ou melhor, instâncias de modelos de conhecimento denominados Ontologias (cujas tecnologias recomendadadas pelo W3C são RDF, RDF-S e OWL, ordenadamente por poder de expressão).

As ontologias são modelos para representação de conhecimento sobre um determinado domínio e seu formalismo lógico é que permite a agentes (inteligentes) de software raciocionar sobre as informações da Web Semântica. O uso de tags só pode ser entendido como uma prática da Web Semântica se as mesmas são, de alguma forma, relacionadas a instâncias de conceitos presentes em ontologias ou alguma outra variante de representação de conhecimento que possa ser aproveitada por máquinas.

Nelson Data: 19/09/2007 às 10:24 am

Atividade:

Cidade:

Diogo Santana Martins

Trecho retirado do Revolução Etc.
http://revolucao.etc.br/archives/folksonomia-e-a-maneira-com-que-nos-colocamos-ordem-nas-coisas/

Folksonomia é uma forma relacional (criar relações entre coisas) de categorizar e classificar na web. Ao invéz de utilizar uma forma hierárquica e centralizada de categorização de alguma coisa, o usuário escolhe palavras-chaves (conhecidas como “tags”) para classificar a informação ou partes de informação. Tag em inglês significa “etiqueta”, “identificação”. “Taggear” é identificar, etiquetar alguma coisa. Não confunda o termo tag abordado aqui com as tags de HTML, eles são dois processos distintos de classificar (dar significado?) as coisas.

Classificando

Diversas aplicações web, comumente aquelas que estão relacionadas a ferramentas sociais e colaborativas, utilizam esta forma de classificação (folksonomia) que é entregue na mão do “povo”, ou seja, dos usuários e dos autores. Classificar suas fotos e compartilhar com amigos no Flickr taggeando cada foto que você insere no seu album, bookmarks sociais no Del.icio.us onde você insere várias keywords (palavras-chaves) para classificar seus bookmarks, ferramentas de blogs como o WordPress onde os autores classificam suas entradas ou artigos em várias “tags” (categorias) ao mesmo tempo, mecanismos de busca especializados em blogs como o Technorati, que fazem buscas relacionadas com as tags que você insere no seu site, editor de texto online como o Writely, que permite você taggear todos seus documentos de texto e, mesmo que nem todos estejam compartilhados, facilita a maneira com que você pode encontrar os documentos que estão relacionados com palavras-chave específicas. São muitas as aplicações que podem utilizar este tipo de classificação conhecida como folksonomia.

Taggear é classificar

O resultado disso no mundo é uma enciclopédia de meta-informação visual gerada pelos usuários. A lógica é a seguinte, quando escrevemos, postamos imagens no Flickr ou taggeamos qualquer coisa na web, nós estamos relacionando um objeto a uma ou mais “tags” (palavras-chave) classificando este objeto. Ou seja, o que fazemos é relacionar determinada informação, como uma página web (Del.icio.us), uma foto (Flickr), um post (blogs) com um determinado conjunto de palavras-chaves. Isso é gerar meta-informação on the fly.

Como assim avaliar?

“Rating” em inglês, significa “avaliar”. Avaliar alguma coisa é fazer apreciação, analisar. Quando você taggeia um artigo no seu blog você está associando um conjunto de tags com o conteúdo, ou seja, você está criando um tipo de “rating” (avaliação) sobre aquele objeto. Você classificou determinado artigo por exemplo, em um conjunto de palavras-chaves. Quando o Google ou o Technorati (e centenas de outros mecanismos de busca) encontram o seu site, eles podem tratar a meta-informação que recebem de várias maneiras. Uma delas é verificar a relação das palavras-chaves que você inseriu com o próprio conteúdo taggeado e confirmar a relevância existente.

Outros bons Links sobre o assunto:
http://revolucao.etc.br/archives/a-relevancia-dobrada/
http://revolucao.etc.br/archives/qual-o-papel-dos-web-standards-na-arquitetura-da-informacao/

Se ainda sim vc achar que o fato de colocar determinada informação no seu devido lugar para que mecanismos de busca avaliem melhor a relevância da informação, não reclame comigo, mande email para o google.

[]’s

Nelson Data: 19/09/2007 às 10:26 am

Atividade:

Cidade:

refazendo a ultima fraze:

Se ainda sim vc discordar que o fato de colocar determinada informação no seu devido lugar para que mecanismos de busca avaliem melhor a relevância da informação, não reclame comigo, mande email para o google.

Luiz Santana Data: 19/09/2007 às 1:44 pm

Atividade:

Cidade: São Carlos

Caro Nelson,

concordo com o Diogo. Dentre os pontos dos quais discordo do seu primeiro texto, destaca-se:

1. “Processo de separar e refinar a informação definindo sua relevância por tags.”.

Acredito que uma forma inicial de atingir os objetivos da Web semântica seria esse processo que vc cita. Contudo, a Web Semântica vai muito além.

2. “Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.”

Na minha opinião, apesar da Web Semântica não lidar com forma em que o conteúdo é criado, sem a Web Semântica esse conteúdo não passa de um conjunto de bytes sobre o qual um computador não pode fazer qualquer tipo de inferência lógica.

Do seu segundo texto, tenho essas ressalvas:

1. Pq vc mandou uma revisão sobre Folksonomia, sendo que o tema do artigo é Web Semântica?

2. “Se ainda sim vc achar que o fato de colocar determinada informação no seu devido lugar para que mecanismos de busca avaliem melhor a relevância da informação, não reclame comigo, mande email para o google.”

Se eu entendi bem o significado dessa frase, gostaria de saber onde no texto do Diogo estão escritas essas afirmações?

Finalmente, talvez vc devesse procurar fontes melhores, como o artigo onde Tim Berners-Lee cita pela primeira vez o termo Semantic Web. Ele está disponível em:
http://www.sciam.com/article.cfm?articleID=00048144-10D2-1C70-84A9809EC588EF21

Se ainda assim vc discordar, continue a discussão, pois é bastante interessante.

Luiz Henrique.

Nelson Data: 19/09/2007 às 6:40 pm

Atividade:

Cidade:

Luiz Santana

1 e 2) Web Semantica é simples. Não tem mistério. Por exemplo: se o titulo do meu site é “carros” e sua descrição é “um site sobre carros, motoristas e mecânicos”, Para que vou colocar mais informção em cima da descrição e o título se os próprios ja definem o objetivo da informação por si só?

Um site Semânticamente correto é: construir ele separando suas determinadas informações usando as tags adequadas.

Suas Resalvas:

1) Não pense que estou sendo grosso, mas se vc não consegue ver a relação entre Web semântica e Folksonomia, é melhor estudar mais sobre o assunto, aproveita e da uma pesquizada sobre Microformats.

2) Coloquei a errata da frase logo depois que postei, tira a palavra achar e poem discordar.

Mas só para clarear, para quem não sabe, o google avalia melhor a relevância da informação indexada por tags, e sites Semanticamente corretos são muito mais fáceis de aparecer nas primeiras páginas da pesquisa. A grosso modo falando: é melhor colocar o titulo e/ou a descrição do seu site desntro de tags como “h1″, “h2″ e etc. do que colocar a informação jogada dentro de uma tabela junto com mais um monte de outras coisas escritas.

Sabendo disso, se alguem diz para mim que web semantica não tem nada a ver com separar a informação determinando sua relevância por tags, então mande um email para o google dizendo que o metodo de pesquisa e seus bots estão completamente errados!

E coloco o Revolução Etc como base não pq sou fã do Henrique Costa Pereira, mas pq ele estuda e se baseia nos melhores como O’Reilly por exemplo.

Diogo Santana Martins Data: 19/09/2007 às 10:34 pm

Atividade:

Cidade: São Carlos - SP

Nelson

Acredito que o principal motivo dessa discussão reside no fato de você estar confundindo uma série de conceitos que não tem relação intrínseca com a Web Semântica. Você está fazendo uma salada desconexa de buzzwords. Sobre as folksonomias, por exemplo, eu acredito que já deixei claro que elas, por si só, não são capazes de expressar significado *que seja processável por máquina*. Veja bem, uma coisa é um ser humano entender o significado da informação, outra são programas o fazerem: isso é Inteligência Artificial, a base da proposta da Web Semântica!

Quanto à sua afirmação:

“Um site Semânticamente correto é: construir ele separando suas determinadas informações usando as tags adequadas.”

Está imprecisa! Se você consultar um dicionário pela palavra *semântica* você vai obter aproximadamente isso: “diz-se do que se ocupa do estudo da significação das palavras”. Essa definição, isoladamente, já descredita uma frase do seu primeiro comentário, que foi o que me motivou a postar nesse site: “Não se cria significado ou sentido, isto já é da própria informação que o usuário coloca.”; realmente o significado é próprio à informação, mas esse significado ou sentido que você cita, é para consumo humano e não para máquinas. O diferencial da Web Semântica é atribuir metadados, que são semânticos (provenientes de ontologias) e, portanto, possibilitam aos computadores — e não às pessoas — entender os significados das informações. Recomendo, sinceramente, que você leia o artigo do Berners-Lee que o Luis apontou, e reflita se a sua definição está correta; eu senti que você não captou o que estamos dizendo quando falamos de “semântica”: talvez por lá isso possa ficar mais claro.

Enfim, você, de uma forma ou de outra, destilou uma série de temas da moda nos seus comentários, como folksomias, Web 2.0, design tableless, microformats, etc, para sem sucesso justificar a sua definição — imprecisa — de Web Semântica. Realmente esses tópicos podem cooperar entre si para um melhor aproveitamento da informação da Web. Mas, antes de tudo, é preciso delimitar bem quando começa um assunto e termina o outro.

PS: O Google, e os sistemas de recuperação de informação em geral, podem muito bem aproveitar-se de todos esses recursos que eu citei no parágrafo anterior, concordo. Mas não faz sentido justificar que a Web Semântica não é semântica (se você prestar bem atenção, é isso que você está dizendo) baseando-se na forma como o Google estabelece a relevância, ou ranking, dos documentos. Um tema não justifica o outro. Os algoritmos empregados pelos mecanismos de busca mais populares, arrisco dizer, pouco ou nem ao menos consideram que as informações que eles indexam possuam metadados semânticos (ressaltando, segundo a conotação de “semântica” defendida pelos estudos relacionados à Web Semântica).

10° luiz Data: 29/09/2007 às 8:57 am

Atividade:

Cidade:

Olá!

O texto não está bom. Para quem entende do assunto, web semântica, o texto não traz novidades, e para um iniciante, não explica quase nada. Faltou foco. Tentou agradar gregos e troianos…

Os comentários estão ótimos. Parabéns!

um abraço!

11° Fernando Mertins Data: 06/10/2007 às 12:30 pm

Atividade: Estudante

Cidade: Novo Hamburgo, RS

Ae pessoal, estou estudando ontologias e Web Semântica há alguns meses e também achei o artigo sem um foco bem definido, serve para ter uma idéia inicial, supercificial do conceito. Sobre a discussão, concordo com algumas opiniões do Nelson mas me parece que ele está pensando o conceito de forma parcial… Sim, é importante criarmos sites semanticamente corretos, ou seja, o que é título deve-se usar uma tag “” e não por exemplo uma “”. Mas a Web Semântica mesmo precisa de muito mais do que isso, como o Diogo Falou, utilizando OWL e suas camadas anteriores. Além disso, para extrair e usar o conhecimento modelado em ontologias precisamos também de um reasoner (classificadores), que são os programas responsáveis pela inferência de novas informações da ontologia.

Para finalizar deixo um exemplo simples: se pesquisarmos no Google por “aparelho de porcelana”, ele encontra itens referentes à aparelho ortodôntico de porcelana mas também encontra itens referentes aos jogos/aparelhos de porcelana para tomar chá, jantar, etc… É exatamente esta separação semântica (significados diferentes) que o robô do Google não sabe fazer. Outro exemplo é pesquisar por “carvalho”, vai encontrar sobrenome e árvores…

12° Paulo Carvalho Data: 11/11/2008 às 10:27 pm

Atividade: Analista de Sistemas

Cidade: Belém

Estou começando a estudar web semântica para aplicação em meu TCC e deu para captar algo do texto e muito mais da troca de idéias. Obrigado pessoal!

Avisos
Os ítens com asterisco ( * ) são campos de preenchimento obrigatório.
Todos os links inseridos nos comentários possuem o atributo rel="nofollow" para impedir com que user agents (como os mecanismos de busca) sigam os links inseridos para desestimular spammers.
Todos devem se identificar através de e-mail válido.
Os e-mails dos usuários não serão divulgados no site.
Comentários:

Preencha os dados abaixo e clique em enviar

Outrolado.com.br

Leia

Procura e não acha? Tente um buscador especializadoGoogle e Yahoo são buscadores muito bons… e generalistas, para atender mais amplamente. Teste estes novos buscadores específicos, verticais ou temáticos e veja se as respostas podem ser mais precisas. Por Eduardo Favaretto

Marcelo Sant'Iago

A importância do Search Engine Marketing Este artigo é direcionado para aquele anunciante ou agência que ainda tem dúvidas se deve ou não investir em estratégias de busca. Por Marcelo Sant’Iago

A internet dentro da história social da mídiaA internet revoluciona o mundo ou o mundo usa a internet para se revolucionar? Livro “Uma história social da mídia, de Gutemberg à Internet”, tenta explicar. Por Carlos Nepomuceno

Promessas de web 3.0: semântica e ubiqüidadeEnquanto ainda se discute sobre o que faz a web 2.0, novos conceitos, tecnologias e serviços já começam a despontar em direção a uma possível web 3.0. Por Humberto Zanetti

Tag machine: novo recurso de tags no FlickrInformações extras inseridas em mecanismos de tags através de uma sintaxe simples ampliam bastante a classificação das imagens. O resultado são buscas muito mais ricas e focadas. Por Humberto Zanetti

Web 3.0, 4.0, 5.0… Boom. Não dá para prever.O passado da web e suas inovações não se apresentaram de forma linear. Foram quebras trazidas dos lugares e personagens mais inesperados. Por Carlos Nepomuceno

Web 2.0 é uma revolução? Então me deixem criticarUma opinião para discutir: nosso amigo diz que o termo Web 2.0 é mal compreendido, mal utilizado e quase traz de volta o clima irreal pré-bolha. Você concorda? Por Alex Hubner

Porque usar os padrões web (ainda em dúvida?)Novos dispositivos e a perspectiva da web 2.0 reforçam os web standards. Trabalhar dentro dos padrões web já é um requisito básico. Ou você acha que não há mais mudanças por vir? Por João Pereira

Webinsider