FMUSER Wirless ينقل الفيديو والصوت بشكل أسهل!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> الأفريكانية
sq.fmuser.org -> الألبانية
ar.fmuser.org -> عربي
hy.fmuser.org -> الأرمينية
az.fmuser.org -> الأذربيجانية
eu.fmuser.org -> الباسك
be.fmuser.org -> البيلاروسية
bg.fmuser.org -> البلغارية
ca.fmuser.org -> الكتالانية
zh-CN.fmuser.org -> الصينية (المبسطة)
zh-TW.fmuser.org -> الصينية (التقليدية)
hr.fmuser.org -> الكرواتية
cs.fmuser.org -> التشيكية
da.fmuser.org -> الدنماركية
nl.fmuser.org -> الهولندية
et.fmuser.org -> الإستونية
tl.fmuser.org -> فلبيني
fi.fmuser.org -> الفنلندية
fr.fmuser.org -> الفرنسية
gl.fmuser.org -> الجاليكية
ka.fmuser.org -> الجورجية
de.fmuser.org -> الألمانية
el.fmuser.org -> اليونانية
ht.fmuser.org -> الكريولية الهايتية
iw.fmuser.org -> عبري
hi.fmuser.org -> الهندية
hu.fmuser.org -> الهنغارية
is.fmuser.org -> الأيسلندية
id.fmuser.org -> الإندونيسية
ga.fmuser.org -> الأيرلندية
it.fmuser.org -> الإيطالية
ja.fmuser.org -> اليابانية
ko.fmuser.org -> كوري
lv.fmuser.org -> اللاتفية
lt.fmuser.org -> ليتوانيا
mk.fmuser.org -> المقدونية
ms.fmuser.org -> الملايو
mt.fmuser.org -> المالطية
no.fmuser.org -> النرويجية
fa.fmuser.org -> فارسي
pl.fmuser.org -> البولندية
pt.fmuser.org -> البرتغالية
ro.fmuser.org -> الرومانية
ru.fmuser.org -> الروسية
sr.fmuser.org -> الصربية
sk.fmuser.org -> السلوفاكية
sl.fmuser.org -> السلوفينية
es.fmuser.org -> الاسبانية
sw.fmuser.org -> السواحيلية
sv.fmuser.org -> السويدية
th.fmuser.org -> التايلاندية
tr.fmuser.org -> التركية
uk.fmuser.org -> الأوكرانية
ur.fmuser.org -> الأردية
vi.fmuser.org -> الفيتنامية
cy.fmuser.org -> الويلزية
yi.fmuser.org -> اليديشية
(1) معلومات زائدة عن إشارة الفيديو
بأخذ تنسيق مكون YUV لتسجيل الفيديو الرقمي كمثال ، يمثل YUV السطوع وإشارات اختلاف اللون على التوالي. على سبيل المثال ، بالنسبة لنظام pal TV الحالي ، فإن تردد أخذ العينات لإشارة النصوع هو 13.5 ميجا هرتز ؛ عادةً ما يكون نطاق تردد إشارة الصفاء نصف أو أقل من إشارة السطوع ، والتي تبلغ 6.75 ميجا هرتز أو 3.375 ميجا هرتز. بأخذ تردد أخذ العينات 4: 2: 2 كمثال ، تتبنى إشارة Y 13.5 ميجا هرتز ، ويتم أخذ عينات من إشارة اللون U و V بمقدار 6.75 ميجا هرتز ، ويتم قياس إشارة أخذ العينات بمقدار 8 بت ، ثم يمكن حساب معدل رمز الفيديو الرقمي كما يلي:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216 ميجابت / ثانية
إذا تم تخزين هذه الكمية الكبيرة من البيانات أو نقلها مباشرة ، فسيكون من الصعب استخدام تقنية الضغط لتقليل معدل البت. يمكن ضغط إشارة الفيديو الرقمية وفقًا لشرطين أساسيين:
L. تكرار البيانات. على سبيل المثال ، التكرار المكاني ، التكرار الزمني ، التكرار الهيكلي ، التكرار في إنتروبيا المعلومات ، إلخ ، أي أن هناك علاقة قوية بين وحدات البكسل في الصورة. لا يؤدي التخلص من هذا التكرار إلى فقدان المعلومات ، وهو ضغط بلا ضياع.
L. التكرار البصري. تختلف بعض خصائص العيون البشرية ، مثل عتبة تمييز السطوع ، والعتبة البصرية ، في الحساسية للسطوع والصفاء ، مما يجعل من المستحيل إدخال أخطاء مناسبة في الترميز ولن يتم اكتشافها. يمكن استخدام الخصائص المرئية للعين البشرية لتبادل ضغط البيانات مع تشويه موضوعي معين. هذا الضغط مع الفقد.
يعتمد ضغط إشارة الفيديو الرقمية على الشرطين المذكورين أعلاه ، مما يجعل بيانات الفيديو مضغوطة بشكل كبير ، مما يساعد على النقل والتخزين. الطرق الشائعة لضغط الفيديو الرقمي هي الترميز المختلط ، وهو الجمع بين تشفير التحويل وتقدير الحركة وتعويض الحركة وتشفير الانتروبيا لضغط التشفير. عادةً ما يتم استخدام تشفير التحويل للقضاء على التكرار داخل الإطار للصورة ، ويتم استخدام تقدير الحركة وتعويض الحركة لإزالة التكرار بين الإطارات للصورة ، ويستخدم ترميز الانتروبيا لتحسين كفاءة الضغط. يتم تقديم طرق تشفير الضغط الثلاث التالية باختصار.
(أ) طريقة تشفير الضغط
(ب) تحويل الترميز
تتمثل وظيفة تشفير التحويل في تحويل إشارة الصورة الموصوفة في المجال الفضائي إلى مجال التردد ، ثم تشفير المعاملات المحولة. بشكل عام ، الصورة لها ارتباط قوي في الفضاء ، ويمكن للتحول إلى مجال التردد أن يحقق العلاقة التزيينية وتركيز الطاقة. يشمل التحويل المتعامد المشترك تحويل فورييه المنفصل وتحويل جيب التمام المنفصل وما إلى ذلك. يستخدم تحويل جيب التمام المنفصل على نطاق واسع في ضغط الفيديو الرقمي.
يشار إلى تحويل جيب التمام المنفصل باسم تحويل DCT. يمكنه تحويل كتلة صورة L * l من مجال فضائي إلى مجال تردد. لذلك ، في عملية ضغط الصور والتشفير على أساس DCT ، يجب تقسيم الصورة إلى كتل صور غير متداخلة. لنفترض أن حجم الصورة هو 1280 * 720 ، وهي مقسمة إلى 160 * 90 كتل صور بحجم 8 * 8 دون تداخل في شكل شبكة. ثم يمكن إجراء تحويل DCT لكل كتلة صورة.
بعد تقسيم الكتلة ، يتم إرسال كل كتلة صورة 8 * 8 نقاط إلى مشفر DCT ، ويتم تحويل كتلة الصورة 8 * 8 من المجال المكاني إلى مجال التردد. يوضح الشكل أدناه مثالاً على كتلة صورة 8 * 8 حيث يمثل الرقم قيمة سطوع كل بكسل. يمكن أن نرى من الشكل أن قيم السطوع لكل بكسل في كتلة الصورة هذه موحدة نسبيًا ، خاصة أن قيمة سطوع وحدات البكسل المجاورة ليست كبيرة جدًا ، مما يشير إلى أن إشارة الصورة لها ارتباط قوي.
كتلة صور فعلية 8 * 8
يوضح الشكل التالي نتائج تحويل DCT لكتلة الصورة في الشكل أعلاه. يمكن أن نرى من الشكل أنه بعد تحويل DCT ، فإن معامل التردد المنخفض في الزاوية اليسرى العليا يركز الكثير من الطاقة ، بينما الطاقة على معامل التردد العالي في الزاوية اليمنى السفلية صغيرة جدًا.
معاملات كتلة الصورة بعد تحويل DCT
يجب قياس الإشارة بعد تحويل DCT. نظرًا لأن عيون الإنسان حساسة لخصائص التردد المنخفض للصور ، مثل السطوع الكلي للأشياء ، وليس للتفاصيل عالية التردد في الصورة ، لذلك في عملية الإرسال ، يمكن نقل المعلومات عالية التردد بشكل أقل أو لا ، فقط جزء التردد المنخفض. تقلل عملية التكميم من نقل المعلومات عن طريق تحديد معاملات منطقة التردد المنخفض والتكمية الخشنة للمعاملات في منطقة التردد العالي ، مما يزيل المعلومات عالية التردد غير الحساسة لأعين الإنسان. لذلك ، فإن التكميم هو عملية ضغط ضياع والسبب الرئيسي لتلف الجودة في تشفير ضغط الفيديو.
يمكن التعبير عن عملية القياس الكمي بالصيغة التالية:
من بينها ، FQ (U ، V) يمثل معامل DCT بعد التكمية ؛ تمثل f (U ، V) معامل DCT قبل التكميم ؛ تمثل Q (U ، V) مصفوفة ترجيح التكميم ؛ ف هي خطوة التكميم ؛ Round يشير إلى التوحيد ، والقيمة المراد إخراجها تؤخذ على أنها أقرب قيمة عدد صحيح.
حدد معامل التكميم بشكل معقول ، وتظهر النتيجة بعد تكميم كتلة الصورة المحولة في الشكل.
معامل DCT بعد التحديد الكمي
يتم تغيير معظم معاملات DCT إلى 0 بعد التكميم ، في حين أن القليل من المعاملات فقط هي قيم غير صفرية. في هذا الوقت ، تحتاج فقط هذه القيم غير الصفرية إلى ضغطها وترميزها.
(ب) ترميز الانتروبيا
تمت تسمية ترميز الانتروبيا لأن متوسط طول الشفرة بعد التشفير قريب من قيمة الانتروبيا للمصدر. يتم تنفيذ تشفير الانتروبيا بواسطة VLC (ترميز متغير الطول) المبدأ الأساسي هو إعطاء رمز قصير للرمز ذي الاحتمالية العالية في المصدر ، وإعطاء رمز طويل للرمز مع احتمال ضئيل لحدوثه ، وذلك للحصول على متوسط طول الشفرة الأقصر إحصائيًا. عادةً ما يشتمل ترميز الطول المتغير على كود Hoffman ، والشفرة الحسابية ، وكود التشغيل ، وما إلى ذلك. يعد ترميز طول التشغيل طريقة ضغط بسيطة للغاية ، وكفاءة الضغط ليست عالية ، ولكن سرعة التشفير وفك التشفير سريعة ، ولا تزال تستخدم على نطاق واسع ، خاصة بعد تحويل الترميز ، باستخدام ترميز طول التشغيل ، يكون له تأثير جيد.
أولاً ، يجب مسح معامل التيار المتردد مباشرة بعد معامل الإخراج DC للمكَمِّي في النوع Z (كما هو موضح في خط السهم). يقوم المسح Z بتحويل معامل التكميم ثنائي الأبعاد إلى تسلسل أحادي البعد ، ثم يقوم بعملية ترميز طول المدى. أخيرًا ، يتم استخدام رمز آخر متغير الطول لتشفير البيانات بعد تشفير التشغيل ، مثل تشفير Hoffman. من خلال هذا النوع من الترميز المتغير الطول ، يتم تحسين كفاءة الترميز بشكل أكبر.
(ج) تقدير الحركة وتعويض الحركة
يعد تقدير الحركة وتعويض الحركة طريقتين فعالتين لإزالة الارتباط بين الاتجاه الزمني لتسلسل الصور. تعتمد طرق تحويل DCT والتكميم والتشفير الانتروبيا الموضحة أعلاه على صورة إطار واحد. من خلال هذه الطرق ، يمكن التخلص من الارتباط المكاني بين وحدات البكسل في الصورة. في الواقع ، بالإضافة إلى الارتباط المكاني ، فإن إشارة الصورة لها ارتباط زمني. على سبيل المثال ، بالنسبة للفيديو الرقمي ذي الخلفية الثابتة مثل بث الأخبار وحركة صغيرة للجسم الرئيسي للصورة ، يكون الاختلاف بين كل صورة صغيرًا جدًا ، والارتباط بين الصور كبير جدًا. في هذه الحالة ، لا نحتاج إلى تشفير كل صورة إطار على حدة ، ولكن يمكننا فقط تشفير الأجزاء المتغيرة من إطارات الفيديو المجاورة ، وذلك لتقليل كمية البيانات بشكل أكبر. يتم تحقيق هذا العمل عن طريق تقدير الحركة وتعويض الحركة.
تقسم تقنية تقدير الحركة بشكل عام صورة الإدخال الحالية إلى عدة كتل فرعية صغيرة للصورة لا تتداخل مع بعضها البعض ، على سبيل المثال ، حجم صورة الإطار هو 1280 * 720. أولاً ، يتم تقسيمها إلى 40 * 45 كتل صورة مع 16 * 16 حجمًا لا يتداخل مع بعضها البعض في شكل شبكة ، وبعد ذلك ، ضمن نطاق نافذة البحث للصورة السابقة أو الصورة الأخيرة ، ابحث عن كتلة لكل كتلة صورة للعثور على كتلة صورة واحدة داخل نطاق نافذة البحث كتلة الصور الأكثر تشابهًا. تسمى عملية البحث تقدير الحركة. من خلال حساب معلومات الموقع بين أكثر مجموعات الصور تشابهًا وكتلة الصورة ، يمكن الحصول على متجه الحركة. بهذه الطريقة ، يمكن طرح كتلة الصورة الحالية من أكثر مجموعات الصور تشابهًا والتي يشير إليها متجه حركة الصورة المرجعية ، ويمكن الحصول على كتلة الصورة المتبقية. نظرًا لأن كل قيمة بكسل في كتلة الصورة المتبقية صغيرة جدًا ، يمكن الحصول على نسبة ضغط أعلى في تشفير الضغط. تسمى عملية الطرح هذه تعويض الحركة.
نظرًا لضرورة استخدام الصورة المرجعية لتقدير الحركة وتعويض الحركة في عملية الترميز ، فمن المهم جدًا تحديد صورة مرجعية. بشكل عام ، يقسم المشفر كل مدخل صورة إطار إلى ثلاثة أنواع مختلفة وفقًا للصور المرجعية المختلفة: إطار I (داخلي) وإطار B (توقع توجيهي) وإطار P (توقع). كما هو مبين في الشكل.
تسلسل نموذجي لهيكل الرتل I ، B ، P.
كما هو مبين في الشكل ، يستخدم الإطار I فقط البيانات الموجودة في الإطار للتشفير ، ولا يحتاج إلى تقدير الحركة وتعويض الحركة أثناء عملية التشفير. من الواضح ، نظرًا لأن I frame لا يلغي ارتباط اتجاه الوقت ، فإن نسبة الضغط منخفضة نسبيًا. في عملية التشفير ، يستخدم الإطار P إطارًا أماميًا I أو إطار P كصورة مرجعية لتعويض الحركة ، وفي الواقع ، يقوم بتشفير الفرق بين الصورة الحالية والصورة المرجعية. يشبه أسلوب تشفير الرتل B الرتل P ، والفرق الوحيد هو أنه يحتاج إلى استخدام إطار I أمامي أو رتل P وإطار I لاحق أو رتل P للتنبؤ أثناء عملية التشفير. وبالتالي ، يحتاج كل تشفير من رتل P إلى استخدام صورة إطار واحدة كصورة مرجعية ، بينما يحتاج الرتل B إلى رتلين كمرجع. في المقابل ، يحتوي الإطار B على نسبة ضغط أعلى من الإطار P.
(د) الترميز المختلط
تقدم الورقة عدة طرق مهمة في ضغط وترميز الفيديو. في التطبيق العملي ، لا يتم فصل هذه الطرق ، وعادة ما يتم دمجها لتحقيق أفضل تأثير ضغط. يوضح الشكل التالي نموذج التشفير الهجين (أي تشفير التحويل + تقدير الحركة وتعويض الحركة + تشفير الانتروبيا). يستخدم النموذج على نطاق واسع في MPEG1 و MPEG2 و H.264 وغيرها من المعايير ، من الشكل ، يمكننا أن نرى أنه يجب تقسيم صورة الإدخال الحالية إلى كتل أولاً ، يجب طرح كتلة الصورة التي تم الحصول عليها بواسطة الكتلة من الصورة المتوقعة بعد تعويض الحركة للحصول على صورة الاختلاف x ، ثم يتم إجراء تحويل DCT وتكميم لكتلة صورة الفرق. تحتوي بيانات الإخراج الكمومية على مكانين مختلفين: الأول هو إرسالها إلى مشفر الانتروبيا للتشفير ، ويتم إخراج دفق الكود المشفر إلى ذاكرة تخزين مؤقت حفظ في الجهاز وانتظار الإرسال. تطبيق آخر هو مواجهة التحديد الكمي والتغيير العكسي للإشارة x '، والذي يضيف إخراج كتلة الصورة مع تعويض الحركة للحصول على إشارة صورة جديدة للتنبؤ ، ويرسل كتلة صورة جديدة للتنبؤ إلى ذاكرة الإطار.
|
أدخل البريد الإلكتروني للحصول على مفاجأة
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> الأفريكانية
sq.fmuser.org -> الألبانية
ar.fmuser.org -> عربي
hy.fmuser.org -> الأرمينية
az.fmuser.org -> الأذربيجانية
eu.fmuser.org -> الباسك
be.fmuser.org -> البيلاروسية
bg.fmuser.org -> البلغارية
ca.fmuser.org -> الكتالانية
zh-CN.fmuser.org -> الصينية (المبسطة)
zh-TW.fmuser.org -> الصينية (التقليدية)
hr.fmuser.org -> الكرواتية
cs.fmuser.org -> التشيكية
da.fmuser.org -> الدنماركية
nl.fmuser.org -> الهولندية
et.fmuser.org -> الإستونية
tl.fmuser.org -> فلبيني
fi.fmuser.org -> الفنلندية
fr.fmuser.org -> الفرنسية
gl.fmuser.org -> الجاليكية
ka.fmuser.org -> الجورجية
de.fmuser.org -> الألمانية
el.fmuser.org -> اليونانية
ht.fmuser.org -> الكريولية الهايتية
iw.fmuser.org -> عبري
hi.fmuser.org -> الهندية
hu.fmuser.org -> الهنغارية
is.fmuser.org -> الأيسلندية
id.fmuser.org -> الإندونيسية
ga.fmuser.org -> الأيرلندية
it.fmuser.org -> الإيطالية
ja.fmuser.org -> اليابانية
ko.fmuser.org -> كوري
lv.fmuser.org -> اللاتفية
lt.fmuser.org -> ليتوانيا
mk.fmuser.org -> المقدونية
ms.fmuser.org -> الملايو
mt.fmuser.org -> المالطية
no.fmuser.org -> النرويجية
fa.fmuser.org -> فارسي
pl.fmuser.org -> البولندية
pt.fmuser.org -> البرتغالية
ro.fmuser.org -> الرومانية
ru.fmuser.org -> الروسية
sr.fmuser.org -> الصربية
sk.fmuser.org -> السلوفاكية
sl.fmuser.org -> السلوفينية
es.fmuser.org -> الاسبانية
sw.fmuser.org -> السواحيلية
sv.fmuser.org -> السويدية
th.fmuser.org -> التايلاندية
tr.fmuser.org -> التركية
uk.fmuser.org -> الأوكرانية
ur.fmuser.org -> الأردية
vi.fmuser.org -> الفيتنامية
cy.fmuser.org -> الويلزية
yi.fmuser.org -> اليديشية
FMUSER Wirless ينقل الفيديو والصوت بشكل أسهل!
اتصل بنا
العنوان
No.305 غرفة HuiLan مبنى رقم 273 Huanpu Road قوانغتشو الصين 510620
الفئات
بريدك الإلكتروني