arm: get_cabac inline asm
authorJanne Grunau <janne-libav@jannau.net>
Wed, 29 Jan 2014 13:48:22 +0000 (14:48 +0100)
committerJanne Grunau <janne-libav@jannau.net>
Sat, 8 Mar 2014 23:45:34 +0000 (00:45 +0100)
Based on the aarch64 asm. CPU cycle counts on cortex-a9 compared to
gcc 4.8.2:
before: 475 decicycles in get_cabac_noinline, 67106035 runs, 2829 skips
after:  393 decicycles in get_cabac_noinline, 67106474 runs, 2390 skips

Overall speedup is above 2%. Code generated by clang 3.4 is slower on
the same hardware and the relative change is a little larger.


No differences found