เป็นเรื่องปกติที่จะเรียกหน่วยความจำแคชว่าหน่วยความจำที่อยู่ในโปรเซสเซอร์ ซึ่งมีความเร็วสูงและใช้เพื่อจัดเก็บข้อมูลที่ใช้บ่อยที่สุดชั่วคราว
ความจำเป็นในการใช้หน่วยความจำแคชนั้นอธิบายได้จากความแตกต่างในความเร็วของการแลกเปลี่ยนข้อมูลระหว่างโปรเซสเซอร์และส่วนต่างๆ ของหน่วยความจำของคอมพิวเตอร์ การทำงานของแอปพลิเคชันใด ๆ เริ่มต้นด้วยการถ่ายโอนข้อมูลที่จำเป็นจากฮาร์ดดิสก์ที่ค่อนข้างช้าไปยัง RAM (หน่วยความจำเข้าถึงโดยสุ่มของคอมพิวเตอร์) ไปยังส่วนการเข้าถึงโดยสุ่มแบบไดนามิก จากนั้นสามารถถ่ายโอนไปยังแคช L2 (หน่วยความจำ L2) ที่อยู่ในชิปโปรเซสเซอร์หรือบนชิป SRAM แยกความเร็วสูงเฉพาะซึ่งอยู่ถัดจากโปรเซสเซอร์ สุดท้าย ข้อมูลที่ใช้มากที่สุดสามารถถ่ายโอนไปยังแคช L1 (หน่วยความจำระดับแรก) ซึ่งเป็นส่วนเฉพาะของโปรเซสเซอร์ ขนาดของแคชระดับแรกจะอยู่ที่ประมาณ 128 KB เท่านั้น ส่วนระดับที่สองคือ 512 KB แล้ว สำหรับการเปรียบเทียบ ขนาดของ RAM สามารถเป็น 1 GB การดำเนินการของคำสั่งใด ๆ เกิดขึ้นตามรูปแบบเฉพาะ: - การวิเคราะห์การลงทะเบียนข้อมูลของข้อมูล - การสแกนข้อมูลของแคชระดับแรก - ตรวจสอบข้อมูลของแคช ของระดับที่สอง - การวิเคราะห์ข้อมูลของหน่วยความจำหลัก - การเข้าถึงหน่วยความจำฮาร์ดดิสก์ เวลาที่โปรเซสเซอร์ใช้ในการรับข้อมูลที่จำเป็นเป็นสัดส่วนโดยตรงกับตำแหน่งที่เก็บข้อมูล ดังนั้นการเข้าถึงแคชระดับแรกจะใช้เวลาตั้งแต่ 1 ถึง 3 รอบ ระดับที่สอง - จากหกถึงสิบสองรอบและไปยังหน่วยความจำหลัก - สิบและในบางกรณี - หลายร้อยรอบ หน่วยความจำแคชมีบทบาทพิเศษในกระบวนการทำงานของเซิร์ฟเวอร์เพราะ การรับส่งข้อมูลระหว่างโปรเซสเซอร์สู่หน่วยความจำมีความสำคัญในกรณีเหล่านี้ โครงสร้าง Cache ยังให้บริการเพื่อลดช่องว่างระหว่างความเร็วโปรเซสเซอร์ ซึ่งเพิ่มขึ้น 50 เปอร์เซ็นต์ต่อปี และอัตราข้อมูล RAM ซึ่งเพิ่มขึ้นเพียง 5 เปอร์เซ็นต์ การพัฒนาหน่วยความจำแคชระดับที่สามและสี่อย่างต่อเนื่องดูเหมือนจะเป็นขั้นตอนที่สมเหตุสมผลในทิศทางนี้ ทิศทางการพัฒนาที่เป็นไปได้อีกประการหนึ่งอาจเป็นการเปลี่ยนไปใช้การจัดการหน่วยความจำแคชแบบเป็นโปรแกรม