Coding 03 Jul 2025

Regex: Jurus Sakti Para Programmer Mengolah Teks

Regex: Jurus Sakti Para Programmer Mengolah Teks

Halo, saya Zona Sosmed, expert di bidang ngoprek teks dan data. Pernahkah kamu merasa kesulitan saat harus mencari pola tertentu dalam sekumpulan teks yang panjang? Atau mungkin kamu perlu memvalidasi format email yang dimasukkan pengguna? Nah, di sinilah Regex hadir sebagai pahlawan tanpa tanda jasa.

Apa itu Regex?

Regex, singkatan dari Regular Expression, adalah urutan karakter yang mendefinisikan pola pencarian. Anggap saja seperti blueprint untuk mencari teks tertentu. Regex bukan bahasa pemrograman, tapi lebih ke sebuah notasi yang dipahami oleh banyak bahasa pemrograman seperti Python, JavaScript, Java, dan lain-lain.

Kenapa Regex Penting dalam Coding?

Regex sangat berguna dalam berbagai skenario:

  • Validasi Data: Memastikan data yang dimasukkan pengguna sesuai format yang diharapkan, misalnya format email, nomor telepon, atau tanggal.
  • Pencarian dan Penggantian Teks: Mencari teks tertentu dalam dokumen besar dan menggantinya dengan teks lain. Bayangkan betapa mudahnya mengganti semua kemunculan kata "lama" menjadi "baru" dalam sebuah buku digital!
  • Ekstraksi Data: Mengambil informasi spesifik dari teks yang tidak terstruktur. Contohnya, mengekstrak semua alamat email dari sebuah halaman web.
  • Parsing Log Files: Menganalisis log files untuk mencari error atau informasi penting lainnya.

Dasar-Dasar Regex: Beberapa Simbol Penting

Regex memiliki banyak simbol dengan makna khusus. Berikut beberapa yang paling sering digunakan:

  • . (titik): Cocok dengan karakter apa pun (kecuali baris baru).
  • * (asterisk): Cocok dengan nol atau lebih kemunculan karakter sebelumnya.
  • + (plus): Cocok dengan satu atau lebih kemunculan karakter sebelumnya.
  • ? (tanda tanya): Cocok dengan nol atau satu kemunculan karakter sebelumnya.
  • [] (kurung siku): Mendefinisikan set karakter yang ingin dicocokkan. Misalnya, [abc] akan cocok dengan 'a', 'b', atau 'c'.
  • ^ (caret): Di dalam kurung siku, berarti negasi. Misalnya, [^abc] akan cocok dengan karakter apa pun kecuali 'a', 'b', atau 'c'. Di luar kurung siku, cocok dengan awal baris.
  • $ (dolar): Cocok dengan akhir baris.
  • \d: Cocok dengan digit (0-9).
  • \w: Cocok dengan karakter word (huruf, angka, atau underscore).
  • \s: Cocok dengan whitespace (spasi, tab, baris baru).

Contoh sederhana: Regex \d+ akan cocok dengan satu atau lebih digit. Jadi, regex ini akan cocok dengan "1", "123", atau "12345", tapi tidak akan cocok dengan "abc".

Contoh Penggunaan Regex dalam Validasi Email

Salah satu contoh klasik penggunaan Regex adalah untuk memvalidasi format email. Regex untuk validasi email bisa sangat kompleks, tapi berikut contoh sederhananya: ^[a-zA-Z0-9._%+-]+@[a-zA-Z0-9.-]+\.[a-zA-Z]{2,}$

Regex ini memeriksa apakah email mengandung:

  • Bagian sebelum @ ([a-zA-Z0-9._%+-]+) yang terdiri dari huruf, angka, titik, underscore, persen, plus, atau minus.
  • Simbol @ (@).
  • Bagian setelah @ ([a-zA-Z0-9.-]+) yang terdiri dari huruf, angka, titik, atau minus.
  • Titik (\.).
  • Domain level atas ([a-zA-Z]{2,}) yang terdiri dari minimal dua huruf.

Tips dan Trik Menggunakan Regex

regex adalah
Bagikan: