07/05/2022
Metadados: as informações ocultas em cada arquivo que você possui.
Cada fotografia tirada com o telemóvel torna-se um arquivo guardado no dispositivo ou um num sistema de cloud computing. Estes arquivos possuem uma parte dedicada ao registro de diversas informações, como a data em que a fotografia foi tirada, horário, local, nome do dispositivo, número de série e, muitas vezes, o nome do proprietário, etc, a estes registros adicionais chamamos metadados, e não estão presentes apenas nas fotos.
Praticamente todos os tipos de arquivos contém metadados associados, documentos Word, Excel, arquivos com extensão PDF. Cada um destes tem os seus próprios metadados, constando informações como o nome do computador ou dispositivo, horários em que o arquivo foi acedido e alterações realizadas, nome do proprietário, etc.
Por muito que sejam úteis a inúmeras atividades profissionais, e até para quem gosta de manter as pastas organizadas, esses dados podem ser usados para expor a privacidade dos utilizadores, dando a possíveis invasores informações fundamentais ao mapeamento dos seus hábitos.
Exagero? Infelizmente nem por isso. Já houve casos de empresas processadas por plágio alegando que, na realidade, possuíam arquivos novos, autênticos, criados por elas. No entanto os metadados, provaram que se tratava de um arquivo de outra companhia, que foi modificado para parecer um documento original, pois os registros de tudo o que foi alterado neste arquivo estava salvo nos metadados – tal como um histórico que registrou toda a sua trajetória.
Dessa maneira, até mesmo um documento Word enviado por um funcionário para um cliente, num anexo de e-mail, pode carregar consigo informações essenciais sobre o negócio.
Porque então os metadados foram criados, se podem representar um eventual problema de segurança digital? Na realidade o seu conceito básico foi concebido há séculos. Ou seja, é desde os tempos antigos que esse tipo de informação é usada para classificar, organizar e pesquisar.
Nesse contexto, definições e regras de negócios, informação de domínios, detalhes de segurança e, entre outros, tags XML são metadados, e todos estes possuem mil possibilidades de uso.
Utilizações variadas
Imagine a utilidade dos metadados na gestão de arquivos e informações. No estoque físico de uma loja virtual, por exemplo, fornecem a localização, o número de caixa, etiqueta e todo o sistema de classificação, bem como os registros do remetente e quais dados devem acompanhar o pedido, como um número de telefone para contato na hora da entrega.
Indo além da gestão documental, tornam-se uma ferramenta estratégica. É o caso da tecnologia Data Warehouse, que trata da extração e consolidação de informações de múltiplas fontes, reunidas em uma base que permite ser consultada de várias maneiras pelos gestores.
Quando aplicados de uma maneira mais ampla, os metadados representam uma verdadeira revolução na internet. É o conceito de Web Semântica, que é uma interligação que proporcionará a chance de computadores e humanos atuarem em um nível diferenciado de cooperação.
Na Web Semântica, todas as informações virão com um significado bem definido, facilmente identificável e classificável pelos sistemas de busca. Ou seja, resultados genéricos ou pouco conectados aos propósitos da pesquisa ficarão cada vez mais raros.
Assim, a Web Semântica deve ser encarada como algo abrangente, com o objetivo de fazer da internet uma base de dados global refinada. Será possível então obter dados semanticamente inter-relacionados, e não apenas uma listagem de documentos nas buscas que fizermos na internet – muitas vezes sem ligação semântica entre si.
Cautela em cada arquivo
Os softwares possuem inúmeras maneiras de coletar dados dos usuários. No Word, por exemplo, notas de rodapé podem incluir informações de autores, que então são registradas nos metadados.
Além disso, existem funções que permitem fazer com que diversas mudanças desapareçam da tela, mas permanecerão nos metadados do arquivo – a exemplo da troca de nomes de proprietários ou de arquivos de imagem anexados que foram substituídos.
Em ambos os casos, os metadados registrarão que houve a troca de um por outro, apesar de apenas os mais recentes ficarem visíveis, já que os anteriores foram trocados.
Entretanto, metadados podem ser alterados pelos próprios usuários. Existem meios para isso, através do sistema operacional ou de softwares especiais.
Dependendo do caso, os metadados podem não ser confiáveis isoladamente, demandando a presença de outros registros para que se verifique sua veracidade. Nesse contexto, um funcionário mal-intencionado poderia deletar rastros de problemas causados por ele.
Assim, se os metadados podem reduzir a privacidade dos usuários, com possíveis exposições de informações, representam um problema para a segurança digital – algo mais acentuado em empresas. Afinal, são registros com nomes de funcionários envolvidos em determinados projetos, horários e dias em que estão trabalhando, entre outros.
Em uma eventual invasão, além da exposição dos arquivos, que por si só podem causar transtornos para as empresas, os metadados podem fornecer detalhes sobre como o trabalho é feito e quais profissionais estão envolvidos, por exemplo, algo valioso nas mãos da concorrência.
É algo que pode ser feito mesmo se os invasores não conseguirem abrir os arquivos, já que alguns metadados podem ser visualizados sem a abertura dos arquivos.
Para que servem os metadados?
- Para encontrar e identificar o destino de uma comunicação;
- Para identificar a data, a hora e a duração de uma comunicação;
- Para identificar o tipo de comunicação;
- Para identificar o equipamento de telecomunicações dos utilizadores ou o que se considera ser o seu equipamento;
- Para identificar a localização do equipamento de comunicação móvel.
O que são os metadados?
- O número de telefone de origem;
- O nome e o endereço do assinante ou do utilizador registado;
- Os números marcados e, em casos que envolvam serviços suplementares, como o reencaminhamento ou a transferência de chamadas, o número ou números para onde a chamada foi reencaminhada;
- A data e a hora do início e do fim da comunicação;
- O identificador da célula no início da comunicação, que permite a localização.
Na internet
- Os códigos de identificação atribuídos ao utilizador;
- O código de identificação do utilizador e o número de telefone atribuídos a qualquer comunicação que entre na rede telefónica pública;
- O nome e o endereço do assinante ou do utilizador registado a quem o endereço do protocolo IP, o código de identificação de utilizador ou o número de telefone estavam atribuídos no momento de determinada comunicação;
- O código de identificação do utilizador ou o número de telefone do destinatário pretendido ou de uma qualquer comunicação telefónica através da internet;
- A data e a hora do início (log in) e do fim (log off) da ligação ao serviço de acesso à internet com base em determinado fuso horário, juntamente com o endereço do protocolo IP, dinâmico ou estático, atribuído pelo fornecedor do serviço de acesso à internet a uma comunicação, bem como o código de identificação de utilizador do subscritor ou do utilizador registado.