برگه معرفی داده یادگیری عمیق
جدیدترین نسخه 1405

یادگیری عمیق

مرجع فارسی برای آشنایی با مجموعه‌داده‌ها، ابزارها و مفاهیم پایه یادگیری عمیق. از تصویر تا متن، مرجعی کامل و کاربردی.

+50
مجموعه‌داده
+120
موضوع پوشش‌داده‌شده
+3K
خواننده
ImageNet
+14 میلیون تصویر
NLP Dataset
+500K متن
GPU Ready
آماده آموزش
ویژگی‌های کلیدی

چرا این برگه متفاوت است؟

برگه‌ای که فقط معرفی نمی‌کند، بلکه مسیر یادگیری را از مفاهیم پایه تا پیاده‌سازی عملی روشن می‌سازد.

داده‌های تصویری

معرفی کامل مجموعه‌داده‌های تصویری از ImageNet تا CIFAR، COCO و سایر بنچمارک‌های استاندارد دنیای بینایی ماشین.

داده‌های متنی NLP

از متن‌های پارسی تا بنچمارک‌های بین‌المللی GLUE و SuperGLUE. آشنایی با توکنایزرها و آماده‌سازی داده برای ترانسفورمرها.

داده‌های سری زمانی

آشنایی با مجموعه‌داده‌های سری زمانی و روش‌های پیش‌پردازش آن‌ها برای مدل‌های RNN، LSTM و Transformer.

پیش‌پردازش حرفه‌ای

تکنیک‌های Data Augmentation، Normalization و Cleaning داده‌ها به‌صورت عملی با کد و توضیح کامل هر مرحله.

GPU و زیرساخت

راهنمای استفاده از GPU رایگان در Google Colab تا تنظیم محیط آموزش روی سرورهای اختصاصی با CUDA و cuDNN.

کد و پیاده‌سازی

کد نمونه PyTorch و TensorFlow برای هر مجموعه‌داده. از بارگذاری داده تا آموزش مدل، همراه با توضیح خط‌به‌خط.

مجموعه‌داده‌ها

مجموعه‌داده‌های پوشش‌داده‌شده

معرفی دقیق و عملی مهم‌ترین مجموعه‌داده‌های جهان یادگیری عمیق با جزئیات فنی کامل.

ImageNet ILSVRC
+14 میلیون تصویر در 1000 کلاس
تصویر
COCO Dataset
تشخیص شیء و سگمنتیشن
تصویر
SQuAD / GLUE
درک متن و بنچمارک NLP
متن
LibriSpeech
+1000 ساعت گفتار انگلیسی
صوت
UCI / Kaggle Datasets
جدولی، سری زمانی و تابولار
تابولار
ImageNet
14M تصویر 1000 کلاس
150 GB
CIFAR-10
60K تصویر 10 کلاس
160 MB
COCO
330K تصویر 80 کلاس
25 GB
SQuAD 2.0
150K سوال متن
40 MB
MNIST
70K تصویر 10 رقم
11 MB
LibriSpeech
1000 ساعت صوت
60 GB
محتوای برگه

مسیر آشنایی

از مفاهیم پایه تا پیاده‌سازی پیشرفته، هر مرحله با تمرین عملی و پروژه واقعی.

1

مبانی داده در یادگیری عمیق

آشنایی با انواع داده‌ها (تصویر، متن، صوت، تابولار)، مفهوم Tensor، و تفاوت داده‌ساختاریافته و ناساختاریافته.

Tensor Data Types Structured vs Unstructured
2

مجموعه‌داده‌های تصویری

بررسی عمیق ImageNet، CIFAR، MNIST، COCO و Fashion-MNIST. نحوه بارگذاری، بررسی آماری و نمایش نمونه‌ها.

ImageNet CIFAR COCO DataLoader
3

مجموعه‌داده‌های NLP

معرفی SQuAD، GLUE، WikiText و مجموعه‌داده‌های فارسی. توکنایزیشن، Vocabulary و آماده‌سازی متن برای ترانسفورمرها.

Tokenization GLUE Persian NLP
4

پیش‌پردازش و Data Augmentation

تکنیک‌های Normalization، Standardization، Cutout، Mixup، CutMix و سایر روش‌های افزایش داده با کد عملی.

Normalization Augmentation Mixup CutMix
5

DataLoader و Pipeline

ساخت Pipeline سفارشی با PyTorch DataLoader، TensorFlow tf.data. مدیریت حافظه، batching و تنظیمات performance.

PyTorch tf.data Batching
6

پروژه عملی End-to-End

پیاده‌سازی کامل یک پروژه از جمع‌آوری داده تا ارزیابی مدل. ساخت Dataset سفارشی، آموزش و تحلیل نتایج.

End-to-End Custom Dataset Evaluation

مقایسه سرعت یادگیری

بدون برگه راهنما
35%
با برگه معرفی داده
92%
بازدهی پروژه
88%
درک مفاهیم پایه
95%
چرا این برگه؟

برگه‌ای که مسیر را روشن می‌کند

این برگه فقط معرفی نیست؛ یک نقشه راه عملی است که زمان سرگردانی شما را نصف می‌کند.

1

محتوای فارسی و بومی‌سازی‌شده

تمام مفاهیم سخت یادگیری عمیق به زبان ساده فارسی توضیح داده شده‌اند. نیازی به جستجوی سنگین در منابع انگلیسی نیست.

2

کد عملی و قابل اجرا

هر بخش با کد PyTorch و TensorFlow همراه است. کد‌ها تست‌شده و آماده اجرا در Google Colab هستند.

3

به‌روزرسانی مداوم

مجموعه‌داده‌ها و ابزارها دائماً به‌روز می‌شوند. با آخرین بنچمارک‌ها و تکنیک‌ها همیشه جلو هستید.

4

پشتیبانی و کامیونیتی

دسترسی به انجمن اختصاصی برای پرسش و پاسخ، اشتراک‌گذاری پروژه‌ها و تبادل تجربه با سایر یادگیرندگان.

مخاطبین

این برگه برای کیست؟

چه مبتدی باشید چه حرفه‌ای، این برگه ارزش متفاوتی برای هر سطح دارد.

دانشجویان

دانشجویان کامپیوتر و هوش مصنوعی که می‌خواهند پایه داده‌ای قوی برای پروژه‌ها و پایان‌نامه بسازند.

توسعه‌دهندگان

برنامه‌نویسانی که می‌خواهند وارد دنیای ML/DL شوند و نیاز به شناخت اکوسیستم داده دارند.

پژوهشگران

محققانی که به دنبال مرجع سریع برای انتخاب مجموعه‌داده مناسب و تکنیک‌های پیش‌پردازش هستند.

حرفه‌ای‌ها

مهندسان داده و ML Engineer‌هایی که می‌خواهند دانش خود را به‌روز و سیستماتیک کنند.

ابزارها

ابزارها و تکنولوژی‌ها

تکنولوژی‌ها و فریم‌ورک‌هایی که در طول این برگه با آن‌ها آشنا می‌شوید.

PT
PyTorch
TF
TensorFlow
PY
Python
CU
CUDA
NP
NumPy
PD
Pandas
OP
OpenCV
HF
HuggingFace
WB
Weights & Biases
CO
Google Colab
MT
Matplotlib
AL
Albumentations
تجربه کاربران

کاربران چه می‌گویند؟

تجربه کسانی که با این برگه مسیر یادگیری خود را شروع کرده‌اند.

قبل از این برگه ساعت‌ها وقت صرف پیدا کردن مجموعه‌داده مناسب می‌کردم. الان فقط بازش می‌کنم و همه‌چیز آماده است. کدهای PyTorch واقعاً کاربردی بودند.

س
سارا محمدی
دانشجوی کارشناسی ارشد AI

بهترین مرجع فارسی که دیدم. تکنیک‌های Augmentation خیلی واضح توضیح داده شده و کدها رو مستقیم توی Colab اجرا کردم. به‌عنوان مرجع عالی کار می‌کنه.

ع
علی رضایی
Backend Developer

به‌عنوان کسی که تازه وارد DL شدم، این برگه کمک کرد مفاهیم پایه داده رو سریع یاد بگیرم و اولین پروژه‌ام رو با راهنمایی‌اش کامل پیاده کنم.

م
مریم احمدی
Data Analyst
همین الان مطالعه کنید

آماده‌اید داده‌های یادگیری عمیق را بشناسید؟

برگه معرفی داده یادگیری عمیق، مرجع کاملی برای شناخت مجموعه‌داده‌ها، ابزارها و مفاهیم پایه است. دسترسی آزاد و رایگان.

دسترسی آزاد
به‌روزرسانی مداوم
کدهای آماده اجرا
انجمن پشتیبان
سوالات متداول

سوالات پرتکرار

آیا نیاز به دانش قبلی یادگیری عمیق دارم؟
خیر، این برگه از صفر شروع می‌شود. فقط آشنایی اولیه با پایتون کافی است. مفاهیم پایه یادگیری عمیق در همان بخش اول به‌صورت ساده توضیح داده شده‌اند و سپس وارد جزئیات مجموعه‌داده‌ها می‌شوید.
آیا کدها در Google Colab قابل اجرا هستند؟
بله، تمام کدها در Google Colab تست شده‌اند و لینک مستقیم Colab برای هر بخش درج شده است. نیازی به تنظیم محیط محلی ندارید؛ فقط یک حساب Gmail کافی است.
آیا مجموعه‌داده‌های فارسی هم پوشش داده شده‌اند؟
بله، در بخش NLP مجموعه‌داده‌های متن فارسی از جمله ParsBERT و سایر بنچمارک‌های فارسی معرفی شده‌اند. همچنین روش‌های ساخت Dataset سفارشی فارسی آموزش داده شده است.
آیا به GPU نیاز دارم؟
برای اکثر تمرین‌ها، GPU رایگان Google Colab کافی است. در بخش زیرساخت، راهنمای کامل استفاده از GPU رایگان و پولی ارائه شده است. برای مجموعه‌داده‌های کوچک مثل MNIST حتی CPU هم جواب می‌دهد.
آیا این برگه رایگان است؟
بله، این برگه به‌صورت آزاد و رایگان در دسترس است. تمام به‌روزرسانی‌های آینده (مثل اضافه شدن مجموعه‌داده‌های جدید و تکنیک‌های نوین Augmentation) نیز رایگان خواهد بود.

درخواست مشاوره کاملا رایگان!