Houve vários casos de detecção baseada em modelo GPT para vários ataques de logs do sistema.
No entanto, não existe uma estrutura dedicada à detecção de APTs, uma vez que utilizam uma abordagem lenta e lenta para comprometer os sistemas.
Pesquisadores de segurança revelaram recentemente uma estrutura de ponta conhecida como LogShield. Esta ferramenta inovadora aproveita os recursos de autoatenção dos transformadores para identificar padrões de ataque associados a ameaças persistentes avançadas (APTs).
Ao analisar os logs da rede, o LogShield pode detectar indicadores sutis de APTs que, de outra forma, poderiam passar despercebidos, fornecendo uma defesa poderosa contra esses ataques sofisticados.
Segundo os pesquisadores, a eficiência desta estrutura foi relatada em 95% e 98%.
LogShield
O principal objetivo do uso de modelos de linguagem para detecção de eventos maliciosos é porque eles foram projetados para processar grandes sequências de palavras ou dados de log, o que é útil no processamento de registros de eventos em um ataque cibernético.
Documento
Além disso, o mecanismo de autoatenção dos modelos GPT pode atribuir pesos diferentes a diferentes eventos com base na sua relatividade com os APTs e pode ser ajustado quanto à importância do evento.
Técnicas de aprendizado de máquina têm sido usadas para detectar padrões de ataque em vez de métodos de detecção de ataque baseados em regras ou assinaturas, que apresentam desempenho relativamente baixo na detecção de APTs de dia zero.
Além disso, vários métodos baseados em aprendizagem profunda foram explorados para detectar ataques APT.
Limitações do LogShield
Embora o LogShield tenha desempenho superior, há uma limitação nesta estrutura. Por ter alto desempenho, também vem com maior consumo de memória e maior tempo computacional. Como parte da pesquisa foram utilizados os modelos LogShield e LSTM.
No entanto, após muitos experimentos, a eficiência foi alcançada com uma pontuação F1 de 98% na detecção de APT.
A relatório sobre o LogShield foi publicado, fornecendo informações detalhadas sobre os modelos de treinamento usando seus dados estatísticos e outras informações.