Google Cloud Lança Open Knowledge Format (OKF): O Novo Padrão para Conhecimento de Agentes de IA

O Google Cloud acaba de formalizar uma ideia que vinha ganhando força na comunidade de IA: a necessidade de um formato padronizado para que agentes de IA possam ler, escrever e compartilhar conhecimento organizacional. Nascia assim o Open Knowledge Format (OKF), anunciado em 12 de junho de 2026 por Sam McVeety e Amir Hormati, líderes técnicos do Google Cloud.
O OKF não é um serviço, plataforma ou runtime. É uma especificação aberta e neutra que transforma o conhecimento institucional em algo trivial: uma pasta de arquivos Markdown com frontmatter YAML. Sem SDK proprietário, sem vendor lock-in, sem banco de dados. Se você consegue fazer cat em um arquivo, você já sabe ler OKF.
O Problema que o OKF Resolve
Hoje, quando uma empresa quer construir um agente de IA que entenda seus dados internos — esquemas de banco, definições de métricas, runbooks de incidentes, caminhos de joins entre tabelas — o conhecimento está fragmentado em silos incompatíveis:
- Catálogos de metadados com APIs proprietárias
- Wikis corporativas
- Comentários em código e docstrings
- Documentos em drives compartilhados
- A cabeça de alguns engenheiros seniores
Cada time reconstrói do zero a mesma lógica de montagem de contexto. Cada vendor reinventa os mesmos modelos de dados. E o conhecimento fica preso na ferramenta que o criou.
A Inspiração: O "LLM Wiki" do Karpathy
A ideia não surgiu do vácuo. Em abril de 2026, Andrej Karpathy publicou um gist que viralizou com mais de 5.000 estrelas, descrevendo o conceito de uma "wiki mantida por LLMs". A premissa: LLMs não ficam entediados, não esquecem de atualizar referências cruzadas e podem editar 15 arquivos em uma única passada.
O OKF pega esse padrão emergente e adiciona a camada de interoperabilidade que faltava. Como resumiu Chaz Chumley (@DataChaz): "O Google está formalizando o poder do LLM Wiki."
Como Funciona na Prática
Um bundle OKF é simplesmente um diretório de arquivos .md. Cada arquivo representa um conceito — uma tabela, dataset, métrica, API ou playbook. O caminho do arquivo é sua identidade.
Exemplo de estrutura:
sales/
├── index.md
├── datasets/
│ ├── index.md
│ └── pedidos_db.md
├── tabelas/
│ ├── index.md
│ ├── pedidos.md
│ └── clientes.md
└── metricas/
├── index.md
└── usuarios_ativos_semanais.md
Exemplo de arquivo de conceito (tabelas/pedidos.md):
---
type: Tabela BigQuery
title: Pedidos
description: Uma linha por pedido concluído.
resource: https://console.cloud.google.com/bigquery?p=acme&d=vendas&t=pedidos
tags: [vendas, receita]
timestamp: 2026-05-28T14:30:00Z
---
# Schema
| Coluna | Tipo | Descrição |
|---------------|--------|------------------------------------|
| `pedido_id` | STRING | Identificador único global. |
| `cliente_id` | STRING | Chave estrangeira para clientes. |
# Joins
Unido com clientes via `cliente_id`.
Princípios de Design
O OKF segue três princípios fundamentais:
- Minimamente opinativo — Apenas o campo
typeé obrigatório. Todo o resto é decisão do produtor. - Independência produtor/consumidor — Um bundle escrito por um humano pode ser lido por um agente. Um bundle gerado por pipeline pode ser navegado visualmente. O formato é o contrato.
- Formato, não plataforma — Sem lock-in de cloud, banco de dados, modelo ou framework. Nenhuma conta proprietária é necessária.
OKF vs. Alternativas
O que diferencia o OKF de abordagens existentes:
| Abordagem | Armazenamento | Portátil | SDK necessário | Legível por agentes |
|---|---|---|---|---|
| OKF v0.1 | Markdown + YAML | Sim | Não | Sim, sem tradução |
| Notion | Banco proprietário | Apenas exportação | API necessária | Via API |
| Obsidian vault | Arquivos Markdown | Sim | Não | Convenções próprias |
| Catálogo de metadados | Vendor store | Apenas exportação | SDK do vendor | Específico do vendor |
| RAG index | Vector store | Não | Sim | Chunks, não conceitos |
Diferença crucial do RAG: RAG recupera chunks brutos e re-deriva conhecimento a cada query. OKF armazena conceitos curados e interligados que o agente lê e atualiza diretamente, com controle de versão.
O Que Foi Lançado
Junto com a especificação, o Google publicou três implementações de referência:
- Agente de Enriquecimento — Percorre datasets do BigQuery e redige conceitos OKF para cada tabela/view, depois os enriquece com citações, schemas e paths de joins usando uma segunda passagem de LLM.
- Visualizador HTML Estático — Converte qualquer bundle OKF em um grafo interativo em um único arquivo autocontido (sem backend, sem instalação, sem dados saindo da página).
- Bundles de Exemplo — Três bundles prontos para navegar: dataset GA4 e-commerce, Stack Overflow público e datasets Bitcoin.
Tudo está disponível no GitHub em GoogleCloudPlatform/knowledge-catalog.
Por Que Isso Importa
O OKF ataca um ponto de dor real e universal: a fragmentação do conhecimento institucional. Em vez de mais uma ferramenta proprietária, o Google escolheu o caminho oposto — um formato aberto, mínimalo e portátil que qualquer um pode adotar.
Para times de dados, significa tratar conhecimento como código: versionar no git, revisar via PRs, automatizar com pipelines. Para agentes de IA, significa ter um "manual de instruções da empresa" que podem ler e atualizar sem depender de integrações frágeis.
Se o OKF ganhar adoção ampla, pode se tornar o "Markdown do conhecimento de agentes" — assim como o README.md virou padrão universal para documentação de projetos, o OKF pode virar o padrão para documentação que máquinas também entendem.