CAVS decoder by (Stefan Gehrer stefan.gehrer gmx.de)
[libav.git] / libavcodec / cavs.c
index c8bf89f..0773045 100644 (file)
@@ -76,7 +76,7 @@ typedef struct {
     /* intra prediction is done with un-deblocked samples
      they are saved here before deblocking the MB  */
     uint8_t *top_border_y, *top_border_u, *top_border_v;
-    uint8_t left_border_y[16], left_border_u[8], left_border_v[8];
+    uint8_t left_border_y[16], left_border_u[10], left_border_v[10];
     uint8_t topleft_border_y, topleft_border_u, topleft_border_v;
 
     void (*intra_pred_l[8])(uint8_t *d,uint8_t *top,uint8_t *left,int stride);
@@ -136,22 +136,22 @@ static inline int get_bs_b(vector_t *mvP, vector_t *mvQ) {
     tc    =    tc_tab[clip(qp_avg + h->alpha_offset,0,63)];
 
 static void filter_mb(AVSContext *h, enum mb_t mb_type) {
-    uint8_t bs[8];
+    DECLARE_ALIGNED_8(uint8_t, bs[8]);
     int qp_avg, alpha, beta, tc;
     int i;
 
     /* save un-deblocked lines */
     h->topleft_border_y = h->top_border_y[h->mbx*16+15];
-    h->topleft_border_u = h->top_border_u[h->mbx*8+7];
-    h->topleft_border_v = h->top_border_v[h->mbx*8+7];
+    h->topleft_border_u = h->top_border_u[h->mbx*10+8];
+    h->topleft_border_v = h->top_border_v[h->mbx*10+8];
     memcpy(&h->top_border_y[h->mbx*16], h->cy + 15* h->l_stride,16);
-    memcpy(&h->top_border_u[h->mbx* 8], h->cu +  7* h->c_stride,8);
-    memcpy(&h->top_border_v[h->mbx* 8], h->cv +  7* h->c_stride,8);
+    memcpy(&h->top_border_u[h->mbx*10+1], h->cu +  7* h->c_stride,8);
+    memcpy(&h->top_border_v[h->mbx*10+1], h->cv +  7* h->c_stride,8);
     for(i=0;i<8;i++) {
         h->left_border_y[i*2+0] = *(h->cy + 15 + (i*2+0)*h->l_stride);
         h->left_border_y[i*2+1] = *(h->cy + 15 + (i*2+1)*h->l_stride);
-        h->left_border_u[i] = *(h->cu + 7 + i*h->c_stride);
-        h->left_border_v[i] = *(h->cv + 7 + i*h->c_stride);
+        h->left_border_u[i+1] = *(h->cu + 7 + i*h->c_stride);
+        h->left_border_v[i+1] = *(h->cv + 7 + i*h->c_stride);
     }
     if(!h->loop_filter_disable) {
         /* clear bs */
@@ -286,27 +286,6 @@ static inline void load_intra_pred_luma(AVSContext *h, uint8_t *top,
     }
 }
 
-static inline void load_intra_pred_chroma(uint8_t *stop, uint8_t *sleft,
-                                          uint8_t stopleft, uint8_t *dtop,
-                                          uint8_t *dleft, int stride, int flags) {
-    int i;
-
-    if(flags & A_AVAIL) {
-        for(i=0; i<8; i++)
-            dleft[i+1] = sleft[i];
-        dleft[0] = dleft[1];
-        dleft[9] = dleft[8];
-    }
-    if(flags & B_AVAIL) {
-        for(i=0; i<8; i++)
-            dtop[i+1] = stop[i];
-        dtop[0] = dtop[1];
-        dtop[9] = dtop[8];
-        if(flags & A_AVAIL)
-            dleft[0] = dtop[0] = stopleft;
-    }
-}
-
 static void intra_pred_vert(uint8_t *d,uint8_t *top,uint8_t *left,int stride) {
     int y;
     uint64_t a = *((uint64_t *)(&top[1]));
@@ -394,8 +373,8 @@ static void intra_pred_lp_top(uint8_t *d,uint8_t *top,uint8_t *left,int stride)
 
 #undef LOWPASS
 
-static inline void modify_pred(const int8_t *mod_table, int *mode) {
-    int newmode = mod_table[(int)*mode];
+static inline void modify_pred(const int_fast8_t *mod_table, int *mode) {
+    int newmode = mod_table[*mode];
     if(newmode < 0) {
         av_log(NULL, AV_LOG_ERROR, "Illegal intra prediction mode\n");
         *mode = 0;
@@ -530,29 +509,25 @@ static void inter_pred(AVSContext *h) {
  *
  ****************************************************************************/
 
-static inline void veccpy(vector_t *dst, vector_t *src) {
-    *((uint64_t *)dst) = *((uint64_t *)src);
-}
-
 static inline void set_mvs(vector_t *mv, enum block_t size) {
     switch(size) {
     case BLK_16X16:
-        veccpy(mv+MV_STRIDE  ,mv);
-        veccpy(mv+MV_STRIDE+1,mv);
+        mv[MV_STRIDE  ] = mv[0];
+        mv[MV_STRIDE+1] = mv[0];
     case BLK_16X8:
-        veccpy(mv          +1,mv);
+        mv[1] = mv[0];
         break;
     case BLK_8X16:
-        veccpy(mv+MV_STRIDE  ,mv);
+        mv[MV_STRIDE] = mv[0];
         break;
     }
 }
 
 static inline void store_mvs(AVSContext *h) {
-    veccpy(&h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 0], &h->mv[MV_FWD_X0]);
-    veccpy(&h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 1], &h->mv[MV_FWD_X1]);
-    veccpy(&h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 2], &h->mv[MV_FWD_X2]);
-    veccpy(&h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 3], &h->mv[MV_FWD_X3]);
+    h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 0] = h->mv[MV_FWD_X0];
+    h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 1] = h->mv[MV_FWD_X1];
+    h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 2] = h->mv[MV_FWD_X2];
+    h->col_mv[(h->mby*h->mb_width + h->mbx)*4 + 3] = h->mv[MV_FWD_X3];
 }
 
 static inline void scale_mv(AVSContext *h, int *d_x, int *d_y, vector_t *src, int distp) {
@@ -692,8 +667,10 @@ static void mv_pred(AVSContext *h, enum mv_loc_t nP, enum mv_loc_t nC,
 
 /* kth-order exponential golomb code */
 static inline int get_ue_code(GetBitContext *gb, int order) {
-    if(order)
-        return (get_ue_golomb(gb) << order) + get_bits(gb,order);
+    if(order) {
+        int ret = get_ue_golomb(gb) << order;
+        return ret + get_bits(gb,order);
+    }
     return get_ue_golomb(gb);
 }
 
@@ -734,7 +711,7 @@ static int decode_residual_block(AVSContext *h, GetBitContext *gb,
         run_buf[i] = run;
     }
     /* inverse scan and dequantization */
-    for(i=i-1;i>=0;i--) {
+    while(--i >= 0){
         pos += 1 + run_buf[i];
         if(pos > 63) {
             av_log(h->s.avctx, AV_LOG_ERROR,
@@ -784,17 +761,17 @@ static inline void init_mb(AVSContext *h) {
 
     /* copy predictors from top line (MB B and C) into cache */
     for(i=0;i<3;i++) {
-        veccpy(&h->mv[MV_FWD_B2+i],&h->top_mv[0][h->mbx*2+i]);
-        veccpy(&h->mv[MV_BWD_B2+i],&h->top_mv[1][h->mbx*2+i]);
+        h->mv[MV_FWD_B2+i] = h->top_mv[0][h->mbx*2+i];
+        h->mv[MV_BWD_B2+i] = h->top_mv[1][h->mbx*2+i];
     }
     h->pred_mode_Y[1] = h->top_pred_Y[h->mbx*2+0];
     h->pred_mode_Y[2] = h->top_pred_Y[h->mbx*2+1];
     /* clear top predictors if MB B is not available */
     if(!(h->flags & B_AVAIL)) {
-        veccpy(&h->mv[MV_FWD_B2],(vector_t *)&un_mv);
-        veccpy(&h->mv[MV_FWD_B3],(vector_t *)&un_mv);
-        veccpy(&h->mv[MV_BWD_B2],(vector_t *)&un_mv);
-        veccpy(&h->mv[MV_BWD_B3],(vector_t *)&un_mv);
+        h->mv[MV_FWD_B2] = un_mv;
+        h->mv[MV_FWD_B3] = un_mv;
+        h->mv[MV_BWD_B2] = un_mv;
+        h->mv[MV_BWD_B3] = un_mv;
         h->pred_mode_Y[1] = h->pred_mode_Y[2] = NOT_AVAIL;
         h->flags &= ~(C_AVAIL|D_AVAIL);
     } else if(h->mbx) {
@@ -804,13 +781,13 @@ static inline void init_mb(AVSContext *h) {
         h->flags &= ~C_AVAIL;
     /* clear top-right predictors if MB C is not available */
     if(!(h->flags & C_AVAIL)) {
-        veccpy(&h->mv[MV_FWD_C2],(vector_t *)&un_mv);
-        veccpy(&h->mv[MV_BWD_C2],(vector_t *)&un_mv);
+        h->mv[MV_FWD_C2] = un_mv;
+        h->mv[MV_BWD_C2] = un_mv;
     }
     /* clear top-left predictors if MB D is not available */
     if(!(h->flags & D_AVAIL)) {
-        veccpy(&h->mv[MV_FWD_D3],(vector_t *)&un_mv);
-        veccpy(&h->mv[MV_BWD_D3],(vector_t *)&un_mv);
+        h->mv[MV_FWD_D3] = un_mv;
+        h->mv[MV_BWD_D3] = un_mv;
     }
     /* set pointer for co-located macroblock type */
     h->col_type = &h->col_type_base[h->mby*h->mb_width + h->mbx];
@@ -827,12 +804,12 @@ static inline int next_mb(AVSContext *h) {
     h->cv += 8;
     /* copy mvs as predictors to the left */
     for(i=0;i<=20;i+=4)
-        veccpy(&h->mv[i],&h->mv[i+2]);
+        h->mv[i] = h->mv[i+2];
     /* copy bottom mvs from cache to top line */
-    veccpy(&h->top_mv[0][h->mbx*2+0],&h->mv[MV_FWD_X2]);
-    veccpy(&h->top_mv[0][h->mbx*2+1],&h->mv[MV_FWD_X3]);
-    veccpy(&h->top_mv[1][h->mbx*2+0],&h->mv[MV_BWD_X2]);
-    veccpy(&h->top_mv[1][h->mbx*2+1],&h->mv[MV_BWD_X3]);
+    h->top_mv[0][h->mbx*2+0] = h->mv[MV_FWD_X2];
+    h->top_mv[0][h->mbx*2+1] = h->mv[MV_FWD_X3];
+    h->top_mv[1][h->mbx*2+0] = h->mv[MV_BWD_X2];
+    h->top_mv[1][h->mbx*2+1] = h->mv[MV_BWD_X3];
     /* next MB address */
     h->mbx++;
     if(h->mbx == h->mb_width) { //new mb line
@@ -841,7 +818,7 @@ static inline int next_mb(AVSContext *h) {
         h->pred_mode_Y[3] = h->pred_mode_Y[6] = NOT_AVAIL;
         /* clear left mv predictors */
         for(i=0;i<=20;i+=4)
-            veccpy(&h->mv[i],(vector_t *)&un_mv);
+            h->mv[i] = un_mv;
         h->mbx = 0;
         h->mby++;
         /* re-calculate sample pointers */
@@ -917,27 +894,39 @@ static void decode_mb_i(AVSContext *h, int is_i_pic) {
     for(block=0;block<4;block++) {
         d = h->cy + h->luma_scan[block];
         load_intra_pred_luma(h, top, left, block);
-        h->intra_pred_l[(int)h->pred_mode_Y[scan3x3[block]]]
+        h->intra_pred_l[h->pred_mode_Y[scan3x3[block]]]
             (d, top, left, h->l_stride);
         if(h->cbp & (1<<block))
             decode_residual_block(h,gb,intra_2dvlc,1,h->qp,d,h->l_stride);
     }
 
     /* chroma intra prediction */
-    load_intra_pred_chroma(&h->top_border_u[h->mbx*8], h->left_border_u,
-                           h->topleft_border_u, top, left, h->c_stride, h->flags);
-    h->intra_pred_c[pred_mode_uv](h->cu, top, left, h->c_stride);
-    load_intra_pred_chroma(&h->top_border_v[h->mbx*8], h->left_border_v,
-                           h->topleft_border_v, top, left, h->c_stride, h->flags);
-    h->intra_pred_c[pred_mode_uv](h->cv, top, left, h->c_stride);
+    /* extend borders by one pixel */
+    h->left_border_u[9] = h->left_border_u[8];
+    h->left_border_v[9] = h->left_border_v[8];
+    h->top_border_u[h->mbx*10+9] = h->top_border_u[h->mbx*10+8];
+    h->top_border_v[h->mbx*10+9] = h->top_border_v[h->mbx*10+8];
+    if(h->mbx && h->mby) {
+        h->top_border_u[h->mbx*10] = h->left_border_u[0] = h->topleft_border_u;
+        h->top_border_v[h->mbx*10] = h->left_border_v[0] = h->topleft_border_v;
+    } else {
+        h->left_border_u[0] = h->left_border_u[1];
+        h->left_border_v[0] = h->left_border_v[1];
+        h->top_border_u[h->mbx*10] = h->top_border_u[h->mbx*10+1];
+        h->top_border_v[h->mbx*10] = h->top_border_v[h->mbx*10+1];
+    }
+    h->intra_pred_c[pred_mode_uv](h->cu, &h->top_border_u[h->mbx*10],
+                                  h->left_border_u, h->c_stride);
+    h->intra_pred_c[pred_mode_uv](h->cv, &h->top_border_v[h->mbx*10],
+                                  h->left_border_v, h->c_stride);
 
     decode_residual_chroma(h);
     filter_mb(h,I_8X8);
 
     /* mark motion vectors as intra */
-    veccpy( &h->mv[MV_FWD_X0], (vector_t *)&intra_mv);
+    h->mv[MV_FWD_X0] = intra_mv;
     set_mvs(&h->mv[MV_FWD_X0], BLK_16X16);
-    veccpy( &h->mv[MV_BWD_X0], (vector_t *)&intra_mv);
+    h->mv[MV_BWD_X0] = intra_mv;
     set_mvs(&h->mv[MV_BWD_X0], BLK_16X16);
     if(h->pic_type != FF_B_TYPE)
         *h->col_type = I_8X8;
@@ -1015,9 +1004,9 @@ static void decode_mb_b(AVSContext *h, enum mb_t mb_type) {
     int flags;
 
     /* reset all MVs */
-    veccpy( &h->mv[MV_FWD_X0], (vector_t *)&dir_mv);
+    h->mv[MV_FWD_X0] = dir_mv;
     set_mvs(&h->mv[MV_FWD_X0], BLK_16X16);
-    veccpy( &h->mv[MV_BWD_X0], (vector_t *)&dir_mv);
+    h->mv[MV_BWD_X0] = dir_mv;
     set_mvs(&h->mv[MV_BWD_X0], BLK_16X16);
     switch(mb_type) {
     case B_SKIP:
@@ -1163,10 +1152,10 @@ static void init_pic(AVSContext *h) {
 
     /* clear some predictors */
     for(i=0;i<=20;i+=4)
-        veccpy(&h->mv[i],(vector_t *)&un_mv);
-    veccpy(&h->mv[MV_BWD_X0], (vector_t *)&dir_mv);
+        h->mv[i] = un_mv;
+    h->mv[MV_BWD_X0] = dir_mv;
     set_mvs(&h->mv[MV_BWD_X0], BLK_16X16);
-    veccpy(&h->mv[MV_FWD_X0], (vector_t *)&dir_mv);
+    h->mv[MV_FWD_X0] = dir_mv;
     set_mvs(&h->mv[MV_FWD_X0], BLK_16X16);
     h->pred_mode_Y[3] = h->pred_mode_Y[6] = NOT_AVAIL;
     h->cy = h->picture.data[0];
@@ -1328,10 +1317,10 @@ static void init_top_lines(AVSContext *h) {
     h->top_qp       = av_malloc( h->mb_width);
     h->top_mv[0]    = av_malloc((h->mb_width*2+1)*sizeof(vector_t));
     h->top_mv[1]    = av_malloc((h->mb_width*2+1)*sizeof(vector_t));
-    h->top_pred_Y   = av_malloc( h->mb_width*2*sizeof(int));
+    h->top_pred_Y   = av_malloc( h->mb_width*2*sizeof(*h->top_pred_Y));
     h->top_border_y = av_malloc((h->mb_width+1)*16);
-    h->top_border_u = av_malloc((h->mb_width+1)*8);
-    h->top_border_v = av_malloc((h->mb_width+1)*8);
+    h->top_border_u = av_malloc((h->mb_width)*10);
+    h->top_border_v = av_malloc((h->mb_width)*10);
 
     /* alloc space for co-located MVs and types */
     h->col_mv       = av_malloc( h->mb_width*h->mb_height*4*sizeof(vector_t));
@@ -1340,7 +1329,7 @@ static void init_top_lines(AVSContext *h) {
 
 static int decode_seq_header(AVSContext *h) {
     MpegEncContext *s = &h->s;
-    extern const AVRational frame_rate_tab[];
+    extern const AVRational ff_frame_rate_tab[];
     int frame_rate_code;
 
     h->profile =         get_bits(&s->gb,8);
@@ -1358,8 +1347,8 @@ static int decode_seq_header(AVSContext *h) {
     s->low_delay =       get_bits1(&s->gb);
     h->mb_width  = (s->width  + 15) >> 4;
     h->mb_height = (s->height + 15) >> 4;
-    h->s.avctx->time_base.den = frame_rate_tab[frame_rate_code].num;
-    h->s.avctx->time_base.num = frame_rate_tab[frame_rate_code].den;
+    h->s.avctx->time_base.den = ff_frame_rate_tab[frame_rate_code].num;
+    h->s.avctx->time_base.num = ff_frame_rate_tab[frame_rate_code].den;
     h->s.avctx->width  = s->width;
     h->s.avctx->height = s->height;
     if(!h->top_qp)
@@ -1411,7 +1400,7 @@ int ff_cavs_find_frame_end(ParseContext *pc, const uint8_t *buf, int buf_size) {
 }
 
 void ff_cavs_flush(AVCodecContext * avctx) {
-    AVSContext *h = (AVSContext *)avctx->priv_data;
+    AVSContext *h = avctx->priv_data;
     h->got_keyframe = 0;
 }
 
@@ -1491,7 +1480,7 @@ static int cavs_decode_frame(AVCodecContext * avctx,void *data, int *data_size,
 }
 
 static int cavs_decode_init(AVCodecContext * avctx) {
-    AVSContext *h = (AVSContext *)avctx->priv_data;
+    AVSContext *h = avctx->priv_data;
     MpegEncContext * const s = &h->s;
 
     MPV_decode_defaults(s);
@@ -1516,13 +1505,13 @@ static int cavs_decode_init(AVCodecContext * avctx) {
     h->intra_pred_c[   INTRA_C_LP_LEFT] = intra_pred_lp_left;
     h->intra_pred_c[    INTRA_C_LP_TOP] = intra_pred_lp_top;
     h->intra_pred_c[    INTRA_C_DC_128] = intra_pred_dc_128;
-    veccpy(&h->mv[ 7], (vector_t *)&un_mv);
-    veccpy(&h->mv[19], (vector_t *)&un_mv);
+    h->mv[ 7] = un_mv;
+    h->mv[19] = un_mv;
     return 0;
 }
 
 static int cavs_decode_end(AVCodecContext * avctx) {
-    AVSContext *h = (AVSContext *)avctx->priv_data;
+    AVSContext *h = avctx->priv_data;
 
     av_free(h->top_qp);
     av_free(h->top_mv[0]);
@@ -1545,6 +1534,6 @@ AVCodec cavs_decoder = {
     NULL,
     cavs_decode_end,
     cavs_decode_frame,
-    CODEC_CAP_TRUNCATED | CODEC_CAP_DELAY, //FIXME is this correct ?
+    CODEC_CAP_DR1 | CODEC_CAP_DELAY,
     .flush= ff_cavs_flush,
 };