Pengelolaan energi pada sistem smart grid merupakan tantangan penting dalam mendukung efisiensi dan keberlanjutan energi, khususnya pada skala rumah tangga. Penelitian ini mengusulkan implementasi algoritma Proximal Policy Optimization (PPO) berbasis Deep Reinforcement Learning (DRL) untuk mengoptimalkan efisiensi penggunaan energi melalui strategi load shifting. Lingkungan simulasi dibangun untuk merepresentasikan konsumsi energi rumah tangga dalam skenario waktu nyata, di mana agen PPO dilatih untuk mengalihkan beban penggunaan listrik ke waktu dengan tarif lebih rendah atau beban sistem yang lebih ringan. Pengujian dilakukan terhadap tiga skema reward dengan dua mode pelatihan, yaitu cepat dan maksimal. Hasil terbaik diperoleh pada kombinasi reward ketiga dengan mode pelatihan maksimal, menghasilkan rata-rata reward sebesar 41690,53 dan efisiensi biaya hingga 95,83% dibandingkan dengan data konsumsi asli. Temuan ini membuktikan bahwa PPO merupakan pendekatan yang efektif dalam pengelolaan energi pada smart grid skala rumah tangga, khususnya dalam mendukung strategi pengalihan beban yang adaptif dan hemat biaya.