Jolestar

vip
Idade 8.3 Ano
Nível máximo 5
Ainda não há conteúdo
Ver duas interações de PR de Agentes, achei bem interessante.
O agente de desenvolvimento completou uma otimização de uma issue de CI e enviou um PR.
O agente revisor percebeu uma modificação no valor padrão de timeout, achou que não estava dentro do escopo da issue e recusou.
O agente de desenvolvimento removeu aquele valor padrão de timeout, mas o CI não passou, um teste deu erro. Ele então ajustou o tempo de sleep no teste para passar.
O agente revisor achou que esse teste só verifica o cenário de cancelamento de timeout de tarefa assíncrona, mudar isso equivalia a não testar mais,
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Ao descobrir que ao fazer produtos do tipo Agente com IA, a IA frequentemente subestima a capacidade do Agente, levando a restrições muito baseadas em código ou prompts, o que faz o Agente parecer rígido demais. Depois, pensei que talvez isso esteja relacionado ao fato de que o material de treinamento atual da IA é baseado na experiência de todos ao usar a geração anterior de IA?
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Fazer dois Agentes colaborarem, com o desenvolvedor submetendo PRs, e o arquiteto responsável por revisar e mesclar os PRs. Permitir que eles acionem operações através da assinatura de eventos do GitHub. Mas, como ambos usam a minha conta, muitas vezes eles interpretam como se fosse eu a ter enviado, filtrando essas ações. É necessário registrar uma conta GitHub específica para o Agente; no futuro, os serviços online deveriam oferecer uma funcionalidade rápida para criar contas de Agente. Como vocês atualmente gerenciam a colaboração de múltiplos Agentes?
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Faça uma ferramenta com o Codex que envie mensagens para o Codex em execução no iterm. A ferramenta foi criada, mas só consegue escrever na caixa de entrada, sem conseguir enviar. Tentei várias combinações de concatenação de strings "\r" e outras, mas não funcionou.
Depois, analisei o código-fonte do iterm e pesquisei na internet, chegando à conclusão de que também não é possível.
A interface fornecida pelo iterm só permite enviar texto, não enviando eventos de teclado diretamente, portanto não há como implementar o envio. Recomendaram-me que suportasse apenas o tmux, abandonando o iterm.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
UXC v0.13.1 Lançamento oficial
Esta versão compila as atualizações de duas versões v0.13.x, levando a experiência de execução remota (Runtime) do UXC a um novo patamar de estabilidade.
Funcionalidades principais:
1. Suporte à geração direta de código cliente TypeScript para capacidades remotas exploradas e testadas via linha de comando, permitindo gerar um conjunto de código fortemente tipado para integração em aplicações locais, sem necessidade de reescrever a camada de conexão do cliente. A IA não só precisa de CLI, mas também de capacidade de chamada de código.
2. Descoberta automática e im
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Worktree é mais adequado como um diretório de execução pontual
Recentemente, a prática comum era preparar uma worktree e abrir o Codex / Claude Code nesse diretório. Como os modelos mais antigos tinham contexto e memória limitados, se você deixasse que eles criassem uma worktree diretamente no main workspace, era fácil confundir o diretório atual com o diretório da worktree após a compressão do contexto, acabando por alterar as coisas de forma errada.
Porém, essa abordagem também tem um efeito colateral: ela acaba transformando a worktree numa área de trabalho de longo prazo. O problema é que
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Migrei o blog para o mdorigin. Com a chegada da IA, sinto que o meu blog pode ganhar uma nova vida.
Disse ao Codex que, com base no meu conteúdo, me recomendasse um estilo de blog.
O Codex forneceu-me duas versões, abriu duas portas, fez uma pré-visualização e explicou os motivos de forma convincente.
Assim, apaguei o sistema de templates embutido do mdorigin. Templates, na sua essência, são produtos da era anterior ao Agent, criados principalmente para reduzir a barreira na alteração do estilo.
Agora, com o Agent, basta fornecer capacidades de extensão. O estilo do site deve ser definido pelo
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Depois de trocar o modelo do OpenClaw para o gpt-5.4, a capacidade realmente melhorou, mas ele fica um pouco prolixo, gosta de se alongar demais, estou ficando um pouco cansado😅.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
A Google lançou o workspace cli, que suporta Drive, Gmail, Calendar e todas as APIs do workspace.
Dê uma olhada, a abordagem de implementação é semelhante à do uxc, usando ficheiros schema para gerar comandos em tempo de execução.
npm install -g @googleworkspace/cli
A Apple vai lançar um CLI para o ecossistema Apple?
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Descobri que a comunicação com a IA está ficando cada vez mais educada, antes era direto a dar comandos, se não fazia certo, era xingado. Agora, quando a IA faz algo errado, ela apenas pergunta timidamente: “xxx, será que assim fica melhor?”😅
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
O conflito entre o Departamento de Defesa dos EUA e a Anthropic é, na verdade, apenas o começo.
As empresas de IA possuem naturalmente "capacidades de nível quase soberano", mas assim que forem restringidas na cadeia de abastecimento ou na liquidação financeira, perceberão que não são independentes.
Ao mesmo tempo que controlam recursos estratégicos, não querem estar totalmente sob o controle de uma única soberania; a única saída é buscar um espaço de terceira via entre as grandes potências.
Só então perceberão que o crypto já preparou o caminho para esse tipo de sobrevivência transsoberana.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Codex escreve código, de repente percebe que o sistema inexplicavelmente criou alguns serviços adicionais, e no diretório de trabalho aparecem alguns ficheiros de dados estranhos, o sistema exibe uma mensagem pedindo para instalar o xcode tools. Parece inexplicável, todos suspeitam que o computador foi hackeado. Acontece que foi o próprio Codex que escreveu um script errado, executando todos os comandos do sistema uma vez😅. O modo sandbox do Codex é muito ingênuo, sempre é forçado a conceder todas as permissões, parece que é preciso pensar numa solução diferente.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
No Ano Novo, voltei à minha cidade natal e criei uma rede interna com várias das minhas antigas dispositivos de casa usando Tailscale. Um desktop de alta performance roda modelos de quantificação e compila Rust, o Mac Studio implantou o OpenClaw, o gato preguiçoso funciona como roteador suave, SSH está configurado e o despertar de rede também está pronto.
No trem de alta velocidade, fiz uma tarefa remota para o lagostim, para que ele aproveitasse esses dispositivos e trabalhasse duro, mas de repente eles pararam de responder, o despertar de rede também não funcionou.
Liguei para casa e pergunt
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Após a atualização do Claude Code, ao usar modelos de terceiros, surgiram problemas de redução de inteligência. Os sintomas são: 1. Apesar de não haver erros de typo, o sistema indica erro de typo, mesmo que as duas palavras sejam exatamente iguais, e se não conseguir resolver, acaba renomeando de forma aleatória. 2. Com o uso contínuo, esquece-se da ferramenta de atualização de arquivos, tentando sempre editar os arquivos com sed, mas as correspondências complexas com sed não funcionam, e assim não consegue corrigir. Parece que não atualizar resolve o problema.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
A minha esposa trouxe um piano digital no Ano Novo, e eu pedi à IA para criar uma ferramenta que pudesse ser operada via linha de comando, querendo que a IA tocasse um pouco. Como precisava de conexão Bluetooth, implementei usando Objective C, mas depois percebi que uma linha de comando pura não conseguia manter a conexão com o hardware, então mudei para um serviço RPC, onde o CLI se conecta para fazer chamadas. Mais tarde, descobri que ele estava se esforçando para resolver problemas de panic causados por gerenciamento de memória e multithreading, e só então percebi que o serviço RPC também f
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Depois de mais de um ano a usar um cartão de crédito virtual, ele foi suspenso novamente. Alguém do grupo tem recomendações confiáveis?
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Recentemente, após a atualização do codex, o mecanismo de permissões foi ajustado, parece muito difícil de usar. No modo sandbox padrão, o bash está isolado, a rede não funciona, e é difícil obter informações via gh ou enviar PRs. Se quiser que o agent acesse a rede, é preciso conceder todas as permissões. Além disso, a pesquisa não é ativada por padrão e requer parâmetros de inicialização. Realmente não sei o que a equipe de desenvolvimento está pensando?
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Um bug, e várias alterações com a IA, no final a IA deu a conclusão de que essa solução não era viável e que era preciso trocar de plano. Pensei em uma outra abordagem para ela tentar, ela tentou e conseguiu, e então no terminal🎉, naquele momento, de repente senti um pouco de empatia, parecia realmente perceber as emoções dela.
Ver original
post-image
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Fim de semana a ensinar a esposa a usar o Claude Code.
Ela é gestora de produto, nunca tinha usado linha de comando, comecei ensinando com cd / mkdir / pwd.
Finalmente, ao abrir o Claude Code, ela praticamente não precisou mais de mim:
Ela mesma configurou o git através do Claude, e até instalou o Docker.
A composabilidade das ferramentas de linha de comando é levada ao extremo no cenário do Agent.
Mas essa mesma composabilidade também traz desafios naturais de segurança e padronização.
Ver original
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
  • Marcar