
Ketika sebuah alert muncul di lingkungan produksi, proses yang terjadi biasanya cukup familiar.
Engineer menerima notifikasi, membuka dashboard monitoring, memeriksa metrics, membaca logs, menelusuri traces, lalu mulai mencari tahu apa yang sebenarnya terjadi.
Meskipun observability modern telah memberikan visibilitas yang jauh lebih baik dibanding sebelumnya, investigasi awal masih menjadi salah satu bagian yang paling memakan waktu dalam proses penanganan insiden.
Di banyak organisasi, proses tersebut masih sangat bergantung pada manusia.
Namun pendekatan tersebut mulai berubah.
Ketika sebuah sistem mengalami gangguan, organisasi umumnya tidak kekurangan data.
Metrics menunjukkan kondisi layanan secara real-time. Logs mencatat aktivitas yang terjadi di dalam sistem. Traces membantu memahami bagaimana request bergerak antar layanan. Riwayat deployment memberikan konteks mengenai perubahan yang baru saja dilakukan.
Tantangannya adalah seluruh informasi tersebut tersebar di berbagai tempat.
Sebelum perbaikan dapat dilakukan, engineer perlu mengumpulkan dan menghubungkan berbagai sinyal tersebut untuk memahami sumber masalah dan menentukan langkah berikutnya.
Pada banyak kasus, aktivitas inilah yang menghabiskan sebagian besar waktu selama incident response.
Engineer belum memperbaiki masalah. Engineer masih berusaha memahami masalahnya.
Salah satu use case Agentic AI yang mulai banyak diperbincangkan adalah kemampuan AI agent untuk melakukan investigasi awal secara mandiri.
Alih-alih menunggu engineer membuka dashboard pertama, agent dapat mulai bekerja segera setelah sebuah alert terdeteksi.
Agent mengakses metrics, logs, traces, dan berbagai sumber observability lainnya untuk mengumpulkan konteks yang relevan. Informasi tersebut kemudian digunakan untuk membangun pemahaman awal mengenai kondisi sistem saat itu.
Ketika engineer mulai melakukan investigasi, mereka tidak lagi memulai dari nol.
Mereka sudah memiliki konteks awal yang dapat membantu mempercepat proses analisis dan pengambilan keputusan.
Sekilas, pendekatan ini mungkin terlihat seperti automation yang lebih canggih.
Namun investigasi insiden tidak selalu mengikuti alur yang dapat diprediksi sebelumnya.
Lonjakan error dapat mengarah pada pengecekan deployment terbaru. Jika tidak ditemukan perubahan yang signifikan, investigasi dapat berlanjut ke traces. Hasil trace kemudian dapat mengarahkan pencarian ke log tertentu atau layanan tertentu yang menunjukkan anomali.
Dengan kata lain, langkah berikutnya sering kali bergantung pada hasil yang ditemukan pada langkah sebelumnya.
Inilah alasan mengapa use case ini sering digunakan untuk menggambarkan konsep Agentic AI.
Agent tidak hanya menjalankan instruksi yang sudah ditentukan. Agent mengevaluasi konteks, memilih sumber informasi yang relevan, lalu menentukan tindakan berikutnya berdasarkan temuan yang muncul selama proses investigasi.
Dalam beberapa implementasi, waktu yang dibutuhkan untuk melakukan triage dilaporkan dapat berkurang hingga 88–95 persen.
Angka tersebut tentu menarik, terutama bagi organisasi yang mengelola lingkungan digital dengan tingkat kompleksitas yang tinggi.
Namun manfaatnya tidak hanya berkaitan dengan kecepatan.
Ketika sebagian proses investigasi awal dapat dilakukan secara otomatis, engineer dapat lebih cepat beralih ke aktivitas yang memberikan nilai lebih besar, yaitu memvalidasi temuan, menentukan tindakan perbaikan, dan memulihkan layanan yang terdampak.
Peran manusia tidak hilang dari proses tersebut.
Titik awal pekerjaannya yang berubah.
Selama ini sistem operasional dirancang untuk mendeteksi masalah dan memberi tahu manusia bahwa sesuatu telah terjadi.
Alert muncul. Engineer menerima notifikasi. Investigasi dimulai.
Model tersebut masih akan tetap relevan.
Namun kini mulai muncul pendekatan baru yang memungkinkan sistem tidak hanya mendeteksi masalah, tetapi juga memulai proses investigasinya.
Perubahan ini mungkin terlihat sederhana.
Namun bagi organisasi yang mengelola ratusan aplikasi, layanan, dan dependensi yang saling terhubung, kemampuan untuk mempersingkat waktu antara deteksi dan pemahaman dapat memberikan dampak operasional yang signifikan.
Karena pada akhirnya, semakin cepat sebuah tim memahami apa yang sebenarnya terjadi, semakin cepat pula mereka dapat mengambil tindakan yang tepat.
Dan mungkin di situlah salah satu nilai paling menarik dari Agentic AI mulai terlihat.