2 years ago[libc] Replace the use of gtest with a new light weight unittest framework.
[libc] Replace the use of gtest with a new light weight unittest framework.

Header files included wrongly using <...> are now included using the
internal path names as the new unittest framework allows us to do so.

2 years agoRemove AllTargetsAsmPrinters
Remove AllTargetsAsmPrinters

It's been an empty target since r360498 and friends
(`git log --grep='Move InstPrinter files to MCTargetDesc.' llvm/lib/Target`),
but due to hwo the way these targets are structured it was silently
an empty target without anyone noticing.

No behavior change.

2 years agoRemove redundant CXXScopeSpec from TemplateIdAnnotation.
Remove redundant CXXScopeSpec from TemplateIdAnnotation.

A TemplateIdAnnotation represents only a template-id, not a
nested-name-specifier plus a template-id. Don't make a redundant copy of
the CXXScopeSpec and store it on the template-id annotation.

This slightly improves error recovery by more properly handling the case
where we would form an invalid CXXScopeSpec while parsing a typename
specifier, instead of accidentally putting the token stream into a
broken "annot_template_id with a scope specifier, but with no preceding
annot_cxxscope token" state.

2 years ago[gn build] Port d3db13af7e5
[gn build] Port d3db13af7e5

2 years ago[gn build] fix build after 22af2cbefc
[gn build] fix build after 22af2cbefc

2 years agoMerge memtag instructions with adjacent stack slots.
Merge memtag instructions with adjacent stack slots.

Detect a run of memory tagging instructions for adjacent stack frame slots,
and replace them with a shorter instruction sequence
* replace STG + STG with ST2G
* replace STGloop + STGloop with STGloop

This code needs to run when stack slot offsets are already known, but before
FrameIndex operands in STG instructions are eliminated; that's the
reason for the new hook in PrologueEpilogue.

This change modifies STGloop and STZGloop pseudos to take the size as an
immediate integer operand, and adds _untied variants of those pseudos
that are allowed to take the base address as a FI operand. This is needed to
simplify recognizing an STGloop instruction as operating on a stack slot

This improves memtag code size by ~0.25%, and it looks like an additional ~0.1%
is possible by rearranging the stack frame such that consecutive STG
instructions reference adjacent slots (patch pending).

2 years ago[MemDepAnalysis/VNCoercion] Move static method to its only use. [NFCI]
[MemDepAnalysis/VNCoercion] Move static method to its only use. [NFCI]

Static method MemoryDependenceResults::getLoadLoadClobberFullWidthSize
does not have or use any info specific to MemoryDependenceResults.
Move it to its only user: VNCoercion.

2 years ago[CMake] Prefer multi-target variables over generic target variables in runtimes build
[CMake] Prefer multi-target variables over generic target variables in runtimes build

Runtimes variables in a multi-target environment are defined like:


In my case, I have a downstream runtimes cache that does the following:


I found that I was always getting the 'target' variable value (OFF) in
my 'target+except' build, which was unexpected.  This behavior was
caused by the loop in llvm/runtimes/CMakeLists.txt that runs through all
variable names, adding '-DVARIABLE_NAME=' options to the subsequent
external project's cmake command.

The issue is that the loop does a single pass, such that if the 'target'
value appears in the cache after the 'target+except' value, the 'target'
value will take precedence. I suggest in my change here that the more
specific 'target+except' value should take precedence always, without
relying on CMake cache ordering.

2 years agohwasan: Remove dead code. NFCI.
hwasan: Remove dead code. NFCI.

2 years ago[profile] Support counter relocation at runtime
[profile] Support counter relocation at runtime

This is an alternative to the continous mode that was implemented in
D68351. This mode relies on padding and the ability to mmap a file over
the existing mapping which is generally only available on POSIX systems
and isn't suitable for other platforms.

This change instead introduces the ability to relocate counters at
runtime using a level of indirection. On every counter access, we add a
bias to the counter address. This bias is stored in a symbol that's
provided by the profile runtime and is initially set to zero, meaning no
relocation. The runtime can mmap the profile into memory at abitrary
location, and set bias to the offset between the original and the new
counter location, at which point every subsequent counter access will be
to the new location, which allows updating profile directly akin to the
continous mode.

The advantage of this implementation is that doesn't require any special
OS support. The disadvantage is the extra overhead due to additional
instructions required for each counter access (overhead both in terms of
binary size and performance) plus duplication of counters (i.e. one copy
in the binary itself and another copy that's mmapped).

2 years ago[CMake] Use LinuxRemoteTI instead of LinuxLocalTI in CrossWinToARMLinux cmake cache
[CMake] Use LinuxRemoteTI instead of LinuxLocalTI in CrossWinToARMLinux cmake cache

2 years ago[libcxx] Introduce LinuxRemoteTI for remote testing
Sergej Jaskiewicz [Fri, 17 Jan 2020 22:26:58 +0000 (01:26 +0300)]
[libcxx] Introduce LinuxRemoteTI for remote testing

This patch adds a new target info object called LinuxRemoteTI.
Unlike LinuxLocalTI, which asks the host system about various things
like available locales, distribution name etc. which don't make sense
if we're testing on a remote board, LinuxRemoteTI uses SSHExecutor
to get information from the target system.

2 years ago[lldb/Docs] Fix formatting for the variable formatting page
[lldb/Docs] Fix formatting for the variable formatting page

2 years ago[mlir][Linalg] Extend linalg vectorization to MatmulOp
Nicolas Vasilache [Fri, 17 Jan 2020 19:26:50 +0000 (14:26 -0500)]
[mlir][Linalg] Extend linalg vectorization to MatmulOp

This is a simple extension to allow vectorization to work not only on GenericLinalgOp
but more generally across named ops too.
For now, this still only vectorizes matmul-like ops but is a step towards more
generic vectorization of Linalg ops.

2 years ago[libc++] Optimize / partially inline basic_string copy constructor
[libc++] Optimize / partially inline basic_string copy constructor

Splits copy constructor up inlining short initialization, outlining long
initialization into __init_long() which is the externally instantiated slow
path initialization.

Subsequently changing the copy ctor to be inlined (not externally instantiated)
provides significant speed ups for short string initialization.

Generated code given:

void StringCopyCtor(void* mem, const std::string& s) {
    std::string*p = new(mem) std::string{s};

        cmp     byte ptr [rsi + 23], 0
        js      .LBB0_2
        mov     rax, qword ptr [rsi + 16]
        mov     qword ptr [rdi + 16], rax
        movups  xmm0, xmmword ptr [rsi]
        movups  xmmword ptr [rdi], xmm0
        jmp     std::basic_string::__init_long # TAILCALL

BM_StringCopy_Empty                                           5.19ns ± 6%             1.50ns ± 8%  -71.02%        (p=0.000 n=10+10)
BM_StringCopy_Small                                           5.14ns ± 8%             1.53ns ± 7%  -70.17%        (p=0.000 n=10+10)
BM_StringCopy_Large                                           18.9ns ± 0%             19.3ns ± 0%   +1.92%        (p=0.000 n=10+10)
BM_StringCopy_Huge                                             309ns ± 1%              316ns ± 5%     ~            (p=0.633 n=8+10)

2 years agohwasan: Move .note.hwasan.globals note to hwasan.module_ctor comdat.
hwasan: Move .note.hwasan.globals note to hwasan.module_ctor comdat.

As of D70146 lld GCs comdats as a group and no longer considers notes in
comdats to be GC roots, so we need to move the note to a comdat with a GC root
section (.init_array) in order to prevent lld from discarding the note.

2 years ago[InstSimplify] add test for select of vector constants; NFC
[InstSimplify] add test for select of vector constants; NFC

2 years ago[InstSimplify] add test for select of FP constants; NFC
[InstSimplify] add test for select of FP constants; NFC

2 years ago[mlir] [VectorOps] Rename Utils.h into VectorUtils.h
[mlir] [VectorOps] Rename Utils.h into VectorUtils.h

First step towards the consolidation
of a lot of vector related utilities
that are now all over the place
(or even duplicated).

2 years agoPass length of string in Go binding of CreateCompileUnit
Pass length of string in Go binding of CreateCompileUnit

2 years ago[xray] Allow instrumenting only function entry and/or only function exit
[xray] Allow instrumenting only function entry and/or only function exit

Extend -fxray-instrumentation-bundle to split function-entry and
function-exit into two separate options, so that it is possible to
instrument only function entry or only function exit.  For use cases
that only care about one or the other this will save significant overhead
and code size.

2 years ago[clang][xray] Add -fxray-ignore-loops option
Ian Levesque [Fri, 17 Jan 2020 21:24:16 +0000 (13:24 -0800)]
XRay allows tuning by minimum function size, but also always instruments
functions with loops in them. If the minimum function size is set to a
large value the loop instrumention ends up causing most functions to be
instrumented anyway. This adds a new flag, -fxray-ignore-loops, to disable
the loop detection logic.

2 years ago[xray] Add xray-ignore-loops option
[xray] Add xray-ignore-loops option

XRay allows tuning by minimum function size, but also always instruments
functions with loops in them.  If the minimum function size is set to a
large value the loop instrumention ends up causing most functions to be
instrumented anyway.  This adds a new flag, xray-ignore-loops, to disable
the loop detection logic.

2 years ago[ms] [llvm-ml] Add placeholder for llvm-ml, based on llvm-mc
[ms] [llvm-ml] Add placeholder for llvm-ml, based on llvm-mc

As discussed on the mailing list, I plan to introduce an ml-compatible MASM assembler as part of providing more of the Windows build tools. This will be similar to llvm-mc, but with different command-line parameters.

This placeholder is purely a stripped-down version of llvm-mc; we'll eventually add support for the Microsoft-style command-line flags, and back it with a MASM parser.

2 years agodebugserver: Pass -arch flags to mig invocation as needed
debugserver: Pass -arch flags to mig invocation as needed

Specify -isysroot and any necessary -arch flags in the `mig` invocation
when CMAKE_OSX_ARCHITECTURES is set (needed for the bridgeOS build).

2 years ago[ELF] Allow R_PLT_PC (R_PC) to a hidden undefined weak symbol
Fangrui Song [Fri, 17 Jan 2020 19:50:00 +0000 (11:50 -0800)]
[ELF] Allow R_PLT_PC (R_PC) to a hidden undefined weak symbol

This essentially reverts b841e119d77ed0502e3a2e710f26a899bef28b3c.

Such code construct can be used in the following way:

  // glibc/stdlib/exit.c
  // clang -fuse-ld=lld => succeeded
  // clang -fuse-ld=lld -fpie -pie => relocation R_PLT_PC cannot refer to absolute symbol
  __attribute__((weak, visibility("hidden"))) extern void __call_tls_dtors();
  void __run_exit_handlers() {
    if (__call_tls_dtors)

Since we allow R_PLT_PC in -no-pie mode, it makes sense to allow it in
-pie mode as well.

2 years agoMove the sysroot attribute from DIModule to DICompileUnit
Move the sysroot attribute from DIModule to DICompileUnit

[this re-applies c0176916a4824812d25a5a22c4ff7c95857b0cd6
 with the correct commit message and phabricator link]

This addresses point 1 of PR44213.

The DW_AT_LLVM_sysroot attribute is used for Clang module debug info,
to allow LLDB to import a Clang module from source. Currently it is
part of each DW_TAG_module, however, it is the same for all modules in
a compile unit. It is more efficient and less ambiguous to store it
once in the DW_TAG_compile_unit.

This should have no effect on DWARF consumers other than LLDB.

2 years agoRevert "Rename DW_AT_LLVM_isysroot to DW_AT_LLVM_sysroot"
Revert "Rename DW_AT_LLVM_isysroot to DW_AT_LLVM_sysroot"

This reverts commit 12e479475a896f664fb721f98c2d6805185ac352.

I accidentally landed this patch with the wrong commit message ...

2 years agoRevert "Attempt to fix Go syntax error"
Revert "Attempt to fix Go syntax error"

This reverts commit c0176916a4824812d25a5a22c4ff7c95857b0cd6.

2 years agoAttempt to fix Go syntax error
Attempt to fix Go syntax error

2 years ago[MLIR] LLVM dialect: Add llvm.atomicrmw
[MLIR] LLVM dialect: Add llvm.atomicrmw

This op is the counterpart to LLVM's atomicrmw instruction. Note that
volatile and syncscope attributes are not yet supported.

This will be useful for upcoming parallel versions of `affine.for` and generally
for reduction-like semantics.

2 years ago[Flang][mlir] add a band-aid to support the creation of mutually recursive types...
[Flang][mlir] add a band-aid to support the creation of mutually recursive types when lowering to LLVM IR

This is a temporary implementation to support Flang.  The LLVM-IR parser
will need to be extended in some way to support recursive types.  The
exact approach here is still a work-in-progress.

Unfortunately, this won't pass roundtrip testing yet. Adding a comment
to the test file as a reminder.

Differential Revision: https://reviews.llvm.org/D72542

2 years ago[libFuzzer] Allow discarding output in ExecuteCommand in Fuchsia.
[libFuzzer] Allow discarding output in ExecuteCommand in Fuchsia.

This commit modifies the way `ExecuteCommand` works in fuchsia by adding
special logic to handle `/dev/null`.

The FuzzerCommand interface does not have a way to "discard" the output,
so other parts of the code just set the output file to `getDevNull()`.
The problem is that fuchsia does not have a named file that is
equivalent to `/dev/null`, so opening that file just fails.

This commit detects whether the specified output file is `getDevNull`,
and if that's the case, it will not copy the file descriptor for stdout
in the spawned process.

NOTE that modifying `FuzzerCommand` to add a "discardOutput" function
involves a significant refactor of all the other platforms, as they all
rely on the `toString()` method of `FuzzerCommand`.

This allows libfuzzer in fuchsia to run with `fork=1`, as the merge
process (`FuzzerMerge.cpp`) invoked `ExecuteCommand` with `/dev/null` as the

2 years agoRevert "[SVE] Pass Scalable argument to VectorType::get in Bitcode Reader"
Revert "[SVE] Pass Scalable argument to VectorType::get in Bitcode Reader"

This reverts commit 5df53a22592729e631c4030f38c599b9f37095b7.

Caused test failures.

2 years ago[mlir][spirv] Explicitly construct ArrayRef from static array
[mlir][spirv] Explicitly construct ArrayRef from static array

Again for pleasing GCC 5.

2 years ago[SVE] Pass Scalable argument to VectorType::get in Bitcode Reader
[SVE] Pass Scalable argument to VectorType::get in Bitcode Reader

* Pass the Scalability test to VectorType::get in order to be
able to deserialize bitcode that contains scalable vector operations

Change-Id: I37fe5b1c0c237a9153130deefdc1a6d595c7f12e

2 years ago[OPENMP]Improve debug locations in OpenMP regions.
[OPENMP]Improve debug locations in OpenMP regions.

Emit more precise debug locations for the OpenMP outlined regions.

2 years ago[Hexagon] Use itinerary for assembler HVX resource checking
[Hexagon] Use itinerary for assembler HVX resource checking

2 years agoUpdate clang test.
Update clang test.

2 years agoUpdate testcase for LLVM IR change (sysroot)
Update testcase for LLVM IR change (sysroot)

2 years ago[TestQuoting] Use the fully qualified path for remote platforms.
[TestQuoting] Use the fully qualified path for remote platforms.

Patch by Jason Molenda, fixes a test failure on arm64 devices.

2 years ago[UnitTests] Add invalidate methods.
[UnitTests] Add invalidate methods.

2 years ago[LazyCallGraph] Add invalidate method.
Alina Sbirlea [Wed, 15 Jan 2020 22:07:58 +0000 (14:07 -0800)]
[LazyCallGraph] Add invalidate method.

Summary: Add invalidate method in LazyCallGraph.

2 years ago[CallGraph] Add invalidate method.
[CallGraph]  Add invalidate method.

Summary: Add invalidate method in CallGraph.

2 years ago[BrachProbablityInfo] Add invalidate method.
[BrachProbablityInfo] Add invalidate method.

Summary: Add invalidate method for BrachProbablityInfo.

2 years ago[AMDGPU] allow multi-dword flat scratch access since GFX9
[AMDGPU] allow multi-dword flat scratch access since GFX9

This is supported starting with GFX9.

Differential Revision: https://reviews.llvm.org/D72865

2 years ago[mlir][spirv] Explicitly construct ArrayRef from array
Lei Zhang [Fri, 17 Jan 2020 18:44:37 +0000 (13:44 -0500)]
[mlir][spirv] Explicitly construct ArrayRef from array

Hopefully this pleases GCC 5.

2 years ago[Hexagon] Move testcase from c1873631d0a8f2acc to proper location
[Hexagon] Move testcase from c1873631d0a8f2acc to proper location

2 years ago[GlobalsModRef] Add invalidate method
[GlobalsModRef] Add invalidate method

Summary: Add invalidate method to GlobalsAA.

2 years ago[InterfaceStubs][test] Add -triple to clang/test/InterfaceStubs/externstatic.c to...
[InterfaceStubs][test] Add -triple to clang/test/InterfaceStubs/externstatic.c to make it robust

llvm-nm on Linux prints 0 line while llvm-nm on macOS prints 1 line.

2 years ago[Hexagon] Refactor HexagonShuffle
[Hexagon] Refactor HexagonShuffle

The check() in HexagonShuffle has been decomposed into smaller steps.
No functionality change is intended with this commit.

2 years ago[mlir] Replace AbstractOperation::classof with a ClassID instance.
[mlir] Replace AbstractOperation::classof with a ClassID instance.

Summary: This field is currently not used by anything, and using a ClassID instance provides better support for more efficient classof.

2 years ago[test] Fix test/ELF/lto/thinlto-obj-path.ll after D52810
[test] Fix test/ELF/lto/thinlto-obj-path.ll after D52810

2 years ago[clang] Set function attributes on SEH filter functions correctly.
[clang] Set function attributes on SEH filter functions correctly.

When compiling with -munwind-tables, the SEH filter funclet needs the uwtable
function attribute, which gets automatically added if we use
SetInternalFunctionAttributes.  The filter funclet is internal so this seems

2 years agoReland "[llvm-nm] Don't report "no symbols" error for files that contain symbols"
Reland "[llvm-nm] Don't report "no symbols" error for files that contain symbols"

2 years ago[test] Fix tests after D52810
[test] Fix tests after D52810

2 years agoRevert "[llvm-nm] Don't report "no symbols" error for files that contain symbols"
Revert "[llvm-nm] Don't report "no symbols" error for files that contain symbols"

This reverts commit ab974161ba699534f3e30b1f4b036eec9c33053c.

This change broke several tests, and the pre-commit bot even warning
me that it would. Doh!

2 years ago[perf-training] Ignore ' (in-process)' prefix from -###
[perf-training] Ignore ' (in-process)' prefix from -###

After D69825, the output of clang -### when running in process can be
prefixed by ' (in-process)'. Skip it.

2 years agoRename DW_AT_LLVM_isysroot to DW_AT_LLVM_sysroot
Rename DW_AT_LLVM_isysroot to DW_AT_LLVM_sysroot

This is a purely cosmetic change that is NFC in terms of the binary
output. I bugs me that I called the attribute DW_AT_LLVM_isysroot
since the "i" is an artifact of GCC command line option syntax
(-isysroot is in the category of -i options) and doesn't carry any
useful information otherwise.

This attribute only appears in Clang module debug info.

Differential Revision: https://reviews.llvm.org/D71722

2 years ago[mlir][spirv] Explicitly set the size of static arrays
[mlir][spirv] Explicitly set the size of static arrays

2 years ago[llvm-nm] Don't report "no symbols" error for files that contain symbols
[llvm-nm] Don't report "no symbols" error for files that contain symbols

Previously we were reporting this error if we were list no symbols
which is not the same thing as the file containing no symbols.

Also, always report the filename when printing errors.

This matches the GNU nm behaviour.

This a followup to https://reviews.llvm.org/D52810

2 years ago[SeparateConstOffsetFromGEP] Fix: sext(a) + sext(b) -> sext(a + b) matches add and...
[SeparateConstOffsetFromGEP] Fix: sext(a) + sext(b) -> sext(a + b) matches add and sub instructions with one another

During the SeparateConstOffsetFromGEP pass, signed extensions are distributed
to the values that feed into them and then later recombined. The recombination
stage is somewhat problematic- it doesn't differ add and sub instructions
from another when matching the sext(a) +/- sext(b) -> sext(a +/- b) pattern
in some instances.

An example- the IR contains:
%subuAuB = unextendedA - unextendedB
%extA = extend A
%extB = extend B
%addeAeB = extA + extB

The problematic optimization will transform that into:

%subuAuB = unextendedA - unextendedB
%extA = extend A
%extB = extend B
%addeAeB = extend subuAuB ; Obviously not semantically equivalent to the IR input.

This patch fixes that.

2 years ago[mlir] Generator converting LLVM intrinsics defs to MLIR ODS
[mlir] Generator converting LLVM intrinsics defs to MLIR ODS

Introduce a new generator for MLIR tablegen driver that consumes LLVM IR
intrinsic definitions and produces MLIR ODS definitions. This is useful to
bulk-generate MLIR operations equivalent to existing LLVM IR intrinsics, such
as additional arithmetic instructions or NVVM.

A test exercising the generation is also added. It reads the main LLVM
intrinsics file and produces ODS to make sure the TableGen model remains in
sync with what is used in LLVM.

Differential Revision: https://reviews.llvm.org/D72926

Yitzhak Mandelbaum [Mon, 6 Jan 2020 16:00:44 +0000 (11:00 -0500)]
[libTooling] Fix bug in Stencil handling of macro ranges

Summary: Currently, an attempt to rewrite source code inside a macro expansion succeeds, but results in empty text, rather than failing with an error.  This patch restructures to the code to explicitly validate ranges before attempting to edit them.

2 years ago[InstCombine] Fix worklist management in DSE (PR44552)
[InstCombine] Fix worklist management in DSE (PR44552)

Fixes https://bugs.llvm.org/show_bug.cgi?id=44552. We need to make
sure that the store is reprocessed, because performing DSE may
expose more DSE opportunities.

There is a slight caveat here though: We need to make sure that we
add back the store the worklist first, because that means it will
be processed after the operands of the removed store have been
processed. This is a general bug in InstCombine worklist management
that I hope to address at some point, but for now it means we need
to do this manually rather than just returning the instruction as

2 years ago[VectorOps] Update vector transfer read op comments.
[VectorOps] Update vector transfer read op comments.

Summary: Update vector transfer read op comments.

2 years ago[mlir][spirv] Add lowering from `loop.if` to `spv.selection`
[mlir][spirv] Add lowering from `loop.if` to `spv.selection`

When lowering `loop.if` to `spv.selection` we explicitly create
a selection header block before the control flow diverges and a
merge block where control flow subsequently converges.

2 years ago[mlir] Improve documentation in ModuleTranslation MLIR to LLVM IR
[mlir] Improve documentation in ModuleTranslation MLIR to LLVM IR

Several functions were missing documentation.

2 years ago[InstCombine] Fix worklist management in return combine
[InstCombine] Fix worklist management in return combine

There are two related bugs here: First, we don't add the operand
we're replacing to the worklist, which means it may not get DCEd
(see test change). Second, usually this would just get picked up
in the next iteration, but we also do not report the instruction
as changed. This means that we do not get that extra instcombine
iteration, and more importantly, may break the pass pipeline, as
the function is not marked as changed.

Differential Revision: https://reviews.llvm.org/D72864

2 years ago[InstCombine] Split assume test in expensive and not; NFC
[InstCombine] Split assume test in expensive and not; NFC

The IR difference in @icmp1 serves as a test for D72864.

2 years ago[InstCombine] Support disabling expensive combines in opt
[InstCombine] Support disabling expensive combines in opt

Currently, there is no way to disable ExpensiveCombines when doing
a standalone opt -instcombine run, as that's the default, and the
opt option can currently only be used to force enable, not to force
disable. The only way to disable expensive combines is via -O1 or -O2,
but that of course also runs the rest of the kitchen sink...

This patch allows using opt -instcombine -expensive-combines=0 to
run InstCombine without ExpensiveCombines.

Differential Revision: https://reviews.llvm.org/D72861

2 years ago[InstCombine] Add test for -expensive-combines option; NFC
[InstCombine] Add test for -expensive-combines option; NFC

This shows that -expensive-combines=0 is ignored.

2 years ago[mlir][spirv] Add `const` qualifier for static arrays
[mlir][spirv] Add `const` qualifier for static arrays

This makes the local variable `implies` to have the correct
type to satisfy ArrayRef's constructor:

  /*implicit*/ constexpr ArrayRef(const T (&Arr)[N])

Hopefully this should please GCC 5.

2 years ago[lldb] Try to fix writing outside temp dir from 4bafceced6a7641be7b090229c6ccef22cf55bff
[lldb] Try to fix writing outside temp dir from 4bafceced6a7641be7b090229c6ccef22cf55bff

2 years ago[AArch64] Make AArch64 specific assembly directives case insensitive
[AArch64] Make AArch64 specific assembly directives case insensitive

Differential Revision: https://reviews.llvm.org/D72923

2 years agoRenamed traverseDecl to TraverseDecl in a test
Renamed traverseDecl to TraverseDecl in a test

RecursiveASTVisitor expects TraverseDecl to be implemented by

2 years ago[DataFlow] Factor two worklist implementations out
Gabor Horvath [Wed, 8 Jan 2020 01:48:49 +0000 (17:48 -0800)]
Right now every dataflow algorithm uses its own worklist implementation.
This is a first step to reduce this duplication. Some upcoming
algorithms such as the lifetime analysis is going to use the factored
out implementations.

Differential Revision: https://reviews.llvm.org/D72380

2 years agoAMDGPU: Don't assert on a16 images on targets without FeatureR128A16
AMDGPU: Don't assert on a16 images on targets without FeatureR128A16

Currently the lowering for i16 image coordinates asserts on gfx10. I'm
somewhat confused by this though. The feature is missing from the
gfx10 feature lists, but the a16 bit appears to be present in the
manual for MIMG instructions.

2 years agoRevert rGb6437b352db9 - "Fix gcc9 "moving a local object in a return statement preven...
Revert rGb6437b352db9 - "Fix gcc9 "moving a local object in a return statement prevents copy elision" Wpessimizing-move warnings."

Fix buildbots

2 years agoRevert rGff3fe145fe48 "Fix gcc9 "moving a local object in a return statement prevents...
Revert rGff3fe145fe48 "Fix gcc9 "moving a local object in a return statement prevents copy elision" Wpessimizing-move warning."

Fix buildbots

2 years agoFix gcc9 "moving a local object in a return statement prevents copy elision" Wpessimi...
Fix gcc9 "moving a local object in a return statement prevents copy elision" Wpessimizing-move warning.

2 years agoFix gcc9 "moving a local object in a return statement prevents copy elision" Wpessimi...
Fix gcc9 "moving a local object in a return statement prevents copy elision" Wpessimizing-move warnings.

2 years ago[x86] try harder to form 256-bit unpck*
[x86] try harder to form 256-bit unpck*

This is another part of a problem noted in PR42024:

The AVX2 code may use awkward 256-bit shuffles vs. the AVX code that gets split
into the expected 128-bit unpack instructions. We have to be selective in
matching the types where we try to do this though. Otherwise, we can end up
with more instructions (in the case of v8x32/v4x64).

Differential Revision: https://reviews.llvm.org/D72575

2 years ago[Hexagon] Improve HVX version checks
[Hexagon] Improve HVX version checks

2 years ago[Hexagon] Add prev65 subtarget feature
Krzysztof Parzyszek [Fri, 17 Jan 2020 15:17:38 +0000 (09:17 -0600)]
There was a change to trap1 instruction between v62 and v65. This
feature will allow the assembler/disassembler to handle different
variants depending on the CPU version.

2 years agoAnother speculative fix for the Windows bots.
Another speculative fix for the Windows bots.

Hopefully fixes:

2 years agoFix a compile error to get bots back to green.
Aaron Ballman [Fri, 17 Jan 2020 14:49:32 +0000 (09:49 -0500)]
Fixes http://lab.llvm.org:8011/builders/clang-x64-windows-msvc/builds/13716

2 years ago[clang-tidy] Disable Checks on If constexpr statements in template Instantiations...
[clang-tidy] Disable Checks on If constexpr statements in template Instantiations for BugproneBranchClone and ReadabilityBracesAroundStatements

Summary: fixes [[ https://bugs.llvm.org/show_bug.cgi?id=32203 | readability-braces-around-statements broken for if constexpr]] and [[ https://bugs.llvm.org/show_bug.cgi?id=44229 | bugprone-branch-clone false positive with template functions and constexpr ]] by disabling the relevant checks on if constexpr statements while inside an instantiated template. This is due to how the else branch of an if constexpr statement is folded away to a null statement if the condition evaluates to false

2 years ago[X86] Split X87/SSE compare classes into WriteFCom + WriteFComX
[X86] Split X87/SSE compare classes into WriteFCom + WriteFComX

Most X87 compare instructions write to the X87 status word, while the SSE (U)COMI compares write to rFLAGS. These are often handled very differently on CPUs (e.g. rFLAGS outputs typically involve a fpu2gpr transfer), and we shouldn't be grouping all these instructions behind a single class - so this patch splits off the SSE compares into a new WriteFComX class (and currently keeps the same behaviours). If there's a need to distinguish between X87 instructions more closely we can investigate that in the future, but as we don't handle any of the X87 side effects at the moment its unlikely to have any notable effect.

2 years ago[SelectionDAG] ComputeKnownBits - assert we're computing the 0'th (difference) result...
Simon Pilgrim [Fri, 17 Jan 2020 12:10:17 +0000 (12:10 +0000)]
[SelectionDAG] ComputeKnownBits - assert we're computing the 0'th (difference) result for the SUB/SUBC cases

Matches what we already do for the ADD/ADDC/ADDE case.

2 years ago[gn build] Port 42a0355816d
[gn build] Port 42a0355816d

2 years agoAdd `bugprone-reserved-identifier`
Add `bugprone-reserved-identifier`

This patch adds bugprone-reserved-identifier, which flags uses of __names _Like
::_this, which are reserved for the implementation. The check can optionally be
inverted, i.e. configured to flag any names that are _not_ reserved, which may
be useful for e.g. standard library implementors.

2 years ago[IR] fix Constant::isElementWiseEqual() to allow for all undef elements compare
[IR] fix Constant::isElementWiseEqual() to allow for all undef elements compare

We could argue that match() should be more flexible here,
but I'm not sure what impact that would have on existing code.

2 years ago[IR] add unit test for Constant::isElementWiseEqual() for undef corner case; NFC
[IR] add unit test for Constant::isElementWiseEqual() for undef corner case; NFC

2 years ago[ARM][MVE] Tail Predicate IsSafeToRemove
[ARM][MVE] Tail Predicate IsSafeToRemove

Introduce a method to walk through use-def chains to decide whether
it's possible to remove a given instruction and its users. These
instructions are then stored in a set until the end of the transform
when they're erased. This is now used to perform checks on the
iteration count (LoopDec chain), element count (VCTP chain) and the
possibly redundant iteration count.

As well as being able to remove chains of instructions, we know also
check that the sub feeding the vctp is producing the expected value.

Differential Revision: https://reviews.llvm.org/D71837

2 years ago[mlir][spirv] Support implied extensions and capabilities
[mlir][spirv] Support implied extensions and capabilities

In SPIR-V, when a new version is introduced, it is possible some
existing extensions will be incorporated into it so that it becomes
implicitly declared if targeting the new version. This affects
conversion target specification because we need to take this into
account when allowing what extensions to use.

For a capability, it may also implies some other capabilities,
for example, the `Shader` capability implies `Matrix` the capability.
This should also be taken into consideration when preparing the
conversion target: when we specify an capability is allowed, all
its recursively implied capabilities are also allowed.

This commit adds utility functions to query implied extensions for
a given version and implied capabilities for a given capability
and updated SPIRVConversionTarget to use them.

This commit also fixes a bug in availability spec. When a symbol
(op or enum case) can be enabled by an extension, we should drop
it's minimal version requirement. Being enabled by an extension
naturally means the symbol can be used by *any* SPIR-V version
as long as the extension is supported. The grammar still encodes
the 'version' field for such cases, but it should be interpreted
as a different way: rather than meaning a minimal version
requirement, it says the symbol becomes core at that specific

Differential Revision: https://reviews.llvm.org/D72765

2 years agoRevert "[mlir][ods] Support dialect specific content emission via hooks"
Revert "[mlir][ods] Support dialect specific content emission via hooks"

This reverts commit 397215cc309df1171a198b11cab3b241db9441db because
this feature needs more discussion.

2 years ago[BasicBlock] fix looping in getPostdominatingDeoptimizeCall
[BasicBlock] fix looping in getPostdominatingDeoptimizeCall

Blindly following unique-successors chain appeared to be a bad idea.
In a degenerate case when block jumps to itself that goes into endless loop.

Discovered this problem when playing with additional changes,
managed to reproduce it on existing LoopPredication code.

Fix by checking a "visited" set while iterating through unique successors.

2 years agoclang-format: [JS] pragmas for tslint, tsc.
clang-format: [JS] pragmas for tslint, tsc.

tslint and tsc (the TypeScript compiler itself) use comment pragmas of
the style:

  // tslint:disable-next-line:foo
  // @ts-ignore

These must not be wrapped and must stay on their own line, in isolation.
For tslint, this required adding it to the pragma regexp. The comments
starting with `@` are already left alone, but this change adds test
coverage for them.

2 years agoclang-format: fix spacing in `operator const char*()`
clang-format: fix spacing in `operator const char*()`

Revision a75f8d98d7ac9e557b238a229a9a2647c71feed1 fixed spacing for operators,
but caused the const and non-const versions to diverge:
// With Style.PointerAlignment = FormatStyle::PAS_Left:

struct A {
  operator char*() { return ""; }
  operator const char *() const { return ""; }

The code was checking if the type specifier was directly preceded by `operator`.
However there could be comments and `const/volatile` in between.

