2 years ago[lldb] [test] Pass LLVM_LIBS_DIR from CMake for linking liblldb
[lldb] [test] Pass LLVM_LIBS_DIR from CMake for linking liblldb

Pass the correct library directory from CMake to dotest.py when linking
liblldb, instead of trying to reconstruct the path from executable path.
This fixes link failures on platforms having non-null

Differential Revision: https://reviews.llvm.org/D73767

2 years agoAMDGPU: Fix divergence analysis of control flow intrinsics
AMDGPU: Fix divergence analysis of control flow intrinsics

The mask results of these should be uniform. The trickier part is the
dummy booleans used as IR glue need to be treated as divergent. This
should make the divergence analysis results correct for the IR the DAG
is constructed from.

This should allow us to eliminate requiresUniformRegister, which has
an expensive, recursive scan over all users looking for control flow
intrinsics. This should avoid recent compile time regressions.

2 years ago[clang-format] Do not treat C# attribute targets as labels
[clang-format] Do not treat C# attribute targets as labels

Summary: Merge '[', 'target' , ':' into a single token for C# attributes to
prevent the target from being seen as a label.

2 years agoNFC: fix unused var warnings in no-assert builds
NFC: fix unused var warnings in no-assert builds

2 years agoResubmit^2: [JumpThreading] Thread jumps through two basic blocks
Resubmit^2: [JumpThreading] Thread jumps through two basic blocks

This reverts commit 41784bed01543315a1d03141e6ddc023fd914c0b.

Since the original revision ead815924e6ebeaf02c31c37ebf7a560b5fdf67b,
this revision fixes three issues:

- This revision fixes the Windows build.  My original patch improperly
  copied EH pads on Windows.  This patch disregards jump threading
  opportunities having to do with EH pads.

- This revision fixes jump threading to a wrong destination.
  Specifically, my original patch treated any Constant other than 0 as 1
  while evaluating the branch condition.  This bug led to treating
  constant expressions like:

    icmp ugt i8* null, inttoptr (i64 4 to i8*)

  to "true".  This patch fixes the bug by calling isOneValue.

- This revision fixes the cost calculation of two basic blocks being
  threaded through.  Note that getJumpThreadDuplicationCost returns
  "(unsigned)~0" for those basic blocks that cannot be duplicated.  If
  we sum of two return values from getJumpThreadDuplicationCost, we
  could have an unsigned overflow like:

    (unsigned)~0 + 5 = 4

  and mistakenly determine that it's safe and profitable to proceed
  with the jump threading opportunity.  The patch fixes the bug by
  checking each return value before summing them up.

[JumpThreading] Thread jumps through two basic blocks

This patch teaches JumpThreading.cpp to thread through two basic
blocks like:

    %var = phi i32* [ null, %bb1 ], [ @a, %bb2 ]
    %tobool = icmp eq i32 %cond, 0
    br i1 %tobool, label %bb4, label ...

    %cmp = icmp eq i32* %var, null
    br i1 %cmp, label bb5, label bb6

by duplicating basic blocks like bb3 above.  Once we duplicate bb3 as
bb3.dup and redirect edge bb2->bb3 to bb2->bb3.dup, we have:

    %var = phi i32* [ @a, %bb2 ]
    %tobool = icmp eq i32 %cond, 0
    br i1 %tobool, label %bb4, label ...

    %var = phi i32* [ null, %bb1 ]
    %tobool = icmp eq i32 %cond, 0
    br i1 %tobool, label %bb4, label ...

    %cmp = icmp eq i32* %var, null
    br i1 %cmp, label bb5, label bb6

Then the existing code in JumpThreading.cpp can thread edge
bb3.dup->bb4 through bb4 and eventually create bb3.dup->bb5.

2 years ago[IRCE] Make IRCE a Function pass.
[IRCE] Make IRCE a Function pass.

Summary: Make InductiveRangeCheckElimination a FunctionPass.

2 years ago[MLIR][GPU] Fix build files for mlir-opt.
[MLIR][GPU] Fix build files for mlir-opt.

The recent refactoring of build files broke building with the MIR CUDA
integration enabled. This fixes it by adding some additional
dependencies to mlir-opt.

Differential Revision: https://reviews.llvm.org/D74041

2 years ago[gn build] Port b198f16e1e1
[gn build] Port b198f16e1e1

2 years agoAMDGPU/GlobalISel: Legalize llvm.amdgcn.s.buffer.load
AMDGPU/GlobalISel: Legalize llvm.amdgcn.s.buffer.load

The 96-bit results need to be widened.

I find the interaction between LegalizerHelper and MIRBuilder somewhat
awkward. The custom legalization is called by the LegalizerHelper, but
then does not have access to the helper. You have to construct a new
helper, which then does not own the MachineIRBuilder, but does modify
it. Maybe custom legalization should be passed the helper?

2 years ago[WPD/LowerTypeTests] Delay lowering/removal of type tests until after ICP
[WPD/LowerTypeTests] Delay lowering/removal of type tests until after ICP

Currently type test assume sequences inserted for devirtualization are
removed during WPD. This patch delays their removal until later in the
optimization pipeline. This is an enabler for upcoming enhancements to
indirect call promotion, for example streamlined promotion guard
sequences that compare against vtable address instead of the target
function, when there are small number of possible vtables (either
determined via WPD or by in-progress type profiling). We need the type
tests to correlate the callsites with the address point offset needed in
the compare sequence, and optionally to associated type summary info
computed during WPD.

This depends on work in D71913 to enable invocation of LowerTypeTests to
drop type test assume sequences, which will now be invoked following ICP
in the ThinLTO post-LTO link pipelines, and also after the existing
export phase LowerTypeTests invocation in regular LTO (which is already
after ICP). We cannot simply move the existing import phase
LowerTypeTests pass later in the ThinLTO post link pipelines, as the
comment in PassBuilder.cpp notes (it must run early because when
performing CFI other passes may disturb the sequences it looks for).

This necessitated adding a new type test resolution "Unknown" that we
can use on the type test assume sequences previously removed by WPD,
that we now want LTT to ignore.

Depends on D71913.

2 years ago[Analyzer] Model STL Algoirthms to improve the iterator checkers
[Analyzer] Model STL Algoirthms to improve the iterator checkers

STL Algorithms are usually implemented in a tricky for performance
reasons which is too complicated for the analyzer. Furthermore inlining
them is costly. Instead of inlining we should model their behavior
according to the specifications.

This patch is the first step towards STL Algorithm modeling. It models
all the `find()`-like functions in a simple way: the result is either
found or not. In the future it can be extended to only return success if
container modeling is also extended in a way the it keeps track of
trivial insertions and deletions.

Differential Revision: https://reviews.llvm.org/D70818

2 years agoAMDGPU/GlobalISel: Fix processing new phi in waterfall loop
Matt Arsenault [Sun, 2 Feb 2020 01:21:44 +0000 (20:21 -0500)]
AMDGPU/GlobalISel: Fix processing new phi in waterfall loop

The adjusted iterator range included the last we just inserted, and
don't want to process. Figure out the new iterator range before
inserting phis. This was a harmless problem, but added an unnecessary
complication for a future patch.

2 years agoGlobalISel: Make LegalizerHelper primitives public
Matt Arsenault [Thu, 30 Jan 2020 23:05:12 +0000 (18:05 -0500)]
GlobalISel: Make LegalizerHelper primitives public

I want to re-use widenScalarDst/moreElementsVectorDst directly.

2 years agoAMDGPU/GlobalISel: Don't use legal v2s16 G_BUILD_VECTOR
Matt Arsenault [Sat, 4 Jan 2020 20:35:26 +0000 (15:35 -0500)]
AMDGPU/GlobalISel: Don't use legal v2s16 G_BUILD_VECTOR

If we have s_pack_* instructions, legalize this to
G_BUILD_VECTOR_TRUNC from s32 elements. This is closer to how how the
s_pack_* instructions really behave.

If we don't have s_pack_ instructions, expand this by creating a merge
to s32 and bitcasting. This expands to the expected bit operations. I
think this eventually should go in a new bitcast legalize action type
in LegalizerHelper.

We already directly emit the shift operations in RegBankSelect for the
vector case. This could possibly be cleaned up, but I also may want to
defer doing this expansion to selection anyway. I'll see about that
when I try to actually match VOP3P instructions.

This breaks the selection of the build_vector since tablegen doesn't
know how to match G_BUILD_VECTOR_TRUNC yet, so just xfail it for now.

2 years ago[lldb/Target] Add Assert StackFrame Recognizer
Med Ismail Bennani [Tue, 4 Feb 2020 16:53:26 +0000 (17:53 +0100)]
[lldb/Target] Add Assert StackFrame Recognizer

When a thread stops, this checks depending on the platform if the top frame is
an abort stack frame. If so, it looks for an assert stack frame in the upper
frames and set it as the most relavant frame when found.

To do so, the StackFrameRecognizer class holds a "Most Relevant Frame" and a
"cooked" stop reason description. When the thread is about to stop, it checks
if the current frame is recognized, and if so, it fetches the recognized frame's
attributes and applies them.


Differential Revision: https://reviews.llvm.org/D73303

Signed-off-by: Med Ismail Bennani <medismail.bennani@gmail.com>
2 years ago[ARM][TargetParser] Improve handling of dependencies between target features
[ARM][TargetParser] Improve handling of dependencies between target features

The patch at https://reviews.llvm.org/D64048 added "negative"
dependency handling in `ARM::appendArchExtFeatures`: feature "noX"
removes all features, which imply "X".

This patch adds the "positive" handling: feature "X" adds all the
feature strings implied by "X".

(This patch also comes from the suggestion here

Differential Revision: https://reviews.llvm.org/D72762

2 years ago[OpenCL] Fix tblgen support for cl_khr_mipmap_image_writes
[OpenCL] Fix tblgen support for cl_khr_mipmap_image_writes

Apply the fix of f780e15caf1 ("[OpenCL] Fix support for
cl_khr_mipmap_image_writes", 2020-01-27) also to the TableGen OpenCL
builtin function definitions.

2 years agoRe-enable a update_cc_test_checks.py tests
Re-enable a update_cc_test_checks.py tests

This test was not running because it still had a REQUIRES: python3 line.
As this is no longer necessary, remove the REQUIRES to run the test

2 years ago[clang][driver] Fix null pointer dereference warning inside PrintActions1 (PR43462)
[clang][driver] Fix null pointer dereference warning inside PrintActions1 (PR43462)

As detailed on PR43462, clang static analyzer is complaining about a null pointer dereference as we provide a 'host' toolchain fallback if the ToolChain pointer is null, but then use that pointer anyhow to report the triple.

Tests indicate the ToolChain pointer is always valid and the 'host' code path is redundant.

Differential Revision: https://reviews.llvm.org/D74046

2 years ago[ARM][MVE] LowOverheadLoops: DCE on the iteration count setup expression
[ARM][MVE] LowOverheadLoops: DCE on the iteration count setup expression

Once we have created a tail-predicated hardware-loop, and thus know the number
of elements that are processed, we want to clean-up the iteration count
expression of that loop. In D73682, we bailed the analysis on conditionally
executed instructions. This adds support for IT-blocks, so that we can handle
these cases again. The restriction is that we only support IT blocks containing
1 statement, but that seems to cover most cases and forms of the iteration
count expression.

Differential Revision: https://reviews.llvm.org/D73947

2 years ago[OPNEMP50][DOCS]Mark array shaping expression as claimed, NFC.
[OPNEMP50][DOCS]Mark array shaping expression as claimed, NFC.

2 years ago[OPENMP][NVPTX]Add NVPTX specific definitions for new/delete operators.
[OPENMP][NVPTX]Add NVPTX specific definitions for new/delete operators.

To use new/delete in NVPTX code we need to define them. Implementation
copied from CUDA wrappers.

2 years ago[MLIR] Add mapping based on ValueRange to BlockAndValueMapper.
[MLIR] Add mapping based on ValueRange to BlockAndValueMapper.

It is often needed to map entire ranges rather than single values. To avoid
writing the same for loop every time, I have added an overload to the map

Differential Revision: https://reviews.llvm.org/D73894

2 years ago[analyzer] Fix a couple of bugs in HTML report generation.
[analyzer] Fix a couple of bugs in HTML report generation.

It should now produce valid HTML again.

Differential Revision: https://reviews.llvm.org/D73993

2 years ago[ARM] Correct syntax of the CLRM insn
[ARM] Correct syntax of the CLRM insn

The predicate should be adjacent to the opcode.

Differential Revision: https://reviews.llvm.org/D74040

2 years ago[MCA] Remove verification check on MayLoad and MayStore. NFCI
[MCA] Remove verification check on MayLoad and MayStore. NFCI

Field NumMicroOpcodes is currently used by mca to model the number of uOPs
dispatched from the uOp-Queue to the out of order backend.  From a 'dispatch'
point of view, an instruction with zero opcodes is still valid; it simply
doesn't consume any dispatch group slots.

However, mca doesn't expect an instruction with zero uOPs to consume pipeline
resources because it is seen as a contradiction.  In practice, it only makes
sense if such an instruction is eliminated and never really executed. It may be
that mca is being too conservative here. However I believe that mca is right,
and we should probably check that inconsistency in CodeGenSchedule.cpp (when we
also verify scheduling classes in general).

This patch removes the check for MayLoad and MayStore in mca.  That check is
probably too conservative: we are already checking if a zero-uops instruction
consumes any processor resources. Note also that instructions with unmodelled
side-effects also tend to set the MayLoad/MayStore flags even if - theoretically
speaking - they might not even consume any hw resources in practice.

In future we may want to implement different checks (possibly outside of mca)
and potentially revisit the logic in mca that verifies instructions.
For that reason I have raised PR44797.

2 years agovisitINSERT_VECTOR_ELT - pull out repeated dyn_cast. NFCI.
Simon Pilgrim [Wed, 5 Feb 2020 12:32:25 +0000 (12:32 +0000)]
visitINSERT_VECTOR_ELT - pull out repeated dyn_cast. NFCI.

This always gets called at least once.

2 years ago[ARM][LowOverheadLoops] Fix loop count chain
[ARM][LowOverheadLoops] Fix loop count chain

Checking that the use-def chain that performs the loop count
isSafeToRemove is not sufficient because it means that we can
remove register copies that we need to restore lr to its correct
value. This change now prevents the transform from kicking in for the
'remove-elem-moves' test which needs to addressed later on.

Differential Revision: https://reviews.llvm.org/D74037

2 years ago[ARM][LowOverheadLoops] Ensure memory predication
[ARM][LowOverheadLoops] Ensure memory predication

While validating each MVE instruction, check that all instructions
that touch memory are somehow predicated upon the VCTP.

Differential Revision: https://reviews.llvm.org/D73616

2 years ago[lldb] Revert some change in data-formatter-objc/main.m that broke TestDataFormatterO...
[lldb] Revert some change in data-formatter-objc/main.m that broke TestDataFormatterObjCNSDate.py

Changing the date2 to an timezone independent value broke the test as the data formatters
uses the current time zone for the summary (so changing it to a time zone independent value
would again break the test in some time zones). We anyway just care about this for date2
which will be printed in a timezone-independent summary.

2 years ago[clangd] Add the missing elaborated types in FindTarget.
[clangd] Add the missing elaborated types in FindTarget.

2 years ago[lldb][NFC] Remove some unnecessary curly braces
[lldb][NFC] Remove some unnecessary curly braces

2 years ago[lldb] Introduce i386 support in NetBSD Process plugin
[lldb] Introduce i386 support in NetBSD Process plugin

Introduce support for i386 platform that is shared with amd64
in the same plugin.  The concept is partially based on the Linux

The plugin tries to reuse as much code as possible.  As a result, i386
register enums are mapped into amd64 values and those are used in actual
code.  The code for accessing FPU and debug registers is shared,
although general-purpose register layouts do not match between the two
kernel APIs and need to be #ifdef-ed.

This layout will also make it possible to add support for debugging
32-bit programs on amd64 with minimal added code.

In order for this to work, I had to add missing data for debug registers
on i386.

Differential Revision: https://reviews.llvm.org/D73802

2 years ago[lldb] Make TestDataFormatterObjCCF.py pass outside California
[lldb] Make TestDataFormatterObjCCF.py pass outside California

This test creates its dates with `NSDate dateWithNaturalLanguageString` which is deprecated and uses the current time zone of the machine to
interpret the input string. This causes that the created NSDate has a different value depending on the locale of the machine
and we hardcoded the value for California's time zone (PST) but the data formatter gives out the GMT value as a string.

This just replaces the use with the timezone-independent dateWithTimeIntervalSince1970 (which we also use in the rest of the test)
to make this pass independently of the time zone of the machine running the test.

2 years ago[OpenCL] Fix support for cl_khr_mipmap_image_writes
[OpenCL] Fix support for cl_khr_mipmap_image_writes

Text of the extension is available here:

Patch by Ilya Mashkov

Differential Revision: https://reviews.llvm.org/D71460

2 years ago[X86] Fix missing load latencies (PR36894)
[X86] Fix missing load latencies (PR36894)

We weren't account for load latencies in the SSE42/AES/CLMUL schedule classes

2 years agoFix MSVC signed/unsigned warning. NFCI.
Simon Pilgrim [Wed, 5 Feb 2020 10:49:43 +0000 (10:49 +0000)]
Fix MSVC signed/unsigned warning. NFCI.

2 years ago[AVR] Add disassembly tests for supported instructions
[AVR] Add disassembly tests for supported instructions

The disassembler of the AVR backend is incomplete: most instructions do
not correctly disassemble yet.

This patch is the first in a series to add disassembly support to the
AVR backend. It starts with adding disassembler tests for instructions
that already disassemble correctly.

Differential Revision: https://reviews.llvm.org/D73911

2 years agoPartially revert c1c9819ef91aab51b5a23fb3027adac5a2f551cc
Partially revert c1c9819ef91aab51b5a23fb3027adac5a2f551cc

Revert the part of that change that broke the
test Passes/./PluginsTests/PluginsTests.LoadPlugin.

2 years ago[CMake] Add missing component dependencies, to fix building for mingw with BUILD_SHAR...
[CMake] Add missing component dependencies, to fix building for mingw with BUILD_SHARED_LIBS

Differential Revision: https://reviews.llvm.org/D73840

2 years ago[clangd] Pull out a isProtoFile function.
[clangd] Pull out a isProtoFile function.

2 years ago[lldb] Ignore type sugar in TypeSystemClang::GetPointerType
[lldb] Ignore type sugar in TypeSystemClang::GetPointerType

Currently having a typedef for ObjC types is breaking member access in LLDB:
typedef NSString Str;
NSString *s; s.length; // OK
Str *s; s.length; // Causes: member reference base type 'Str *' (aka 'NSString *') is not a structure or union

This works for NSString as there the type building from `NSString` -> `NSString *` will correctly
build a ObjCObjectPointerType (which is necessary to make member access with a dot possible),
but for the typedef the `Str` -> `Str *` conversion will produce an incorrect PointerType. The reason
for this is that our check in TypeSystemClang::GetPointerType is not desugaring the base type,
which causes that `Str` is not recognised as a type to a `ObjCInterface` as the check only sees the
typedef sugar that was put around it. This causes that we fall back to constructing a PointerType
instead which does not allow member access with the dot operator.

This patch just changes the check to look at the desugared type instead.

Fixes rdar://17525603

2 years ago[AMDGPU] Fix lowering a16 image intrinsics
[AMDGPU] Fix lowering a16 image intrinsics

scalar_to_vector takes only one argument, not two.
The a16 tests now also check the packing of coordinates into registers

Differential Revision: https://reviews.llvm.org/D73482

2 years ago[AMDGPU] Use v3f32 type in image instructions
[AMDGPU] Use v3f32 type in image instructions

This should lower the amount of used registers for gfx9.

I updated some of the changed tests with the update script because
changing them by hand is tedious.

Differential Revision: https://reviews.llvm.org/D73884

2 years ago[yaml2obj][obj2yaml] - Simplify format of the SHT_LLVM_ADDRSIG section.
[yaml2obj][obj2yaml] - Simplify format of the SHT_LLVM_ADDRSIG section.

Previously the description allowed to describe symbols with use of
`Name` and `Index` keys. This patch removes them and now it is still
possible to use either names or symbol indexes, but the code is simpler
and the format is slightly different.

Such a change will be useful for another patches, e.g:

Differential revision: https://reviews.llvm.org/D73888

2 years ago[clangd] Use printf instead of `echo -e` to be compliant with dash
[clangd] Use printf instead of `echo -e` to be compliant with dash

2 years ago[DebugInfo] Avoid the call site param for mem instrs with multiple defs
[DebugInfo] Avoid the call site param for mem instrs with multiple defs

We currently only handle mem instructions with a single define.
Avoid the call site parameter debug info when we find the case with
multiple defs, rather than throwing an assert.

Differential Revision: https://reviews.llvm.org/D73954

2 years ago[clangd] Preserve -nostdinc and --sysroot when calling query driver
[clangd] Preserve -nostdinc and --sysroot when calling query driver

Solves this issue: https://github.com/clangd/clangd/issues/157

This is my first contribution to an llvm project, so I hope I'm doing it right!

Patch by @topisani (Tobias Pisani)!

2 years ago[X86] Add a DAG combine for (i32 (sext (i8 (x86isd::setcc_carry)))) -> (i32 (x86isd...
[X86] Add a DAG combine for (i32 (sext (i8 (x86isd::setcc_carry)))) -> (i32 (x86isd::setcc_carry)) and remove isel patterns.

Same for any_extend though we don't have coverage for that.

The test changes are because isel didn't check one use of the
setcc_carry. So in isel we would end up with two different
sized setcc_carry instructions. And since it clobbers
the flags we would need to recreate the flags for the second

This code handles additional uses by truncating the new wide
setcc_carry back to the original size for those uses.

2 years ago[CMake] Passthrough CMAKE_SYSTEM_NAME to default builtin and runtimes target
[CMake] Passthrough CMAKE_SYSTEM_NAME to default builtin and runtimes target

When building the default builtin and runtimes target, set the
CMAKE_SYSTEM_NAME to the current one. This is not necessary on
Linux and Darwin, but it appears to be necessary on Windows,
otherwise CMake fails.

Differential Revision: https://reviews.llvm.org/D73811

2 years ago[CMake][compiler-rt] Replace Windows backslashes with CMake ones
[CMake][compiler-rt] Replace Windows backslashes with CMake ones

XRay builds uses llvm-config to obtain the ldflags and libs and then
passes those to CMake. Unfortunately, this breaks on Windows because
CMake tries to interpret backslashes followed by certain characters
as flags. We need to rewrite these into forward slashes that are used
by CMake (even on Windows).

Differential Revision: https://reviews.llvm.org/D73523

2 years agoRemove leftover artifacts from use of gtest.
Remove leftover artifacts from use of gtest.

2 years agoAMDGPU/EG,CM: Implement fsqrt using recip(rsqrt(x)) instead of x * rsqrt(x)
AMDGPU/EG,CM: Implement fsqrt using recip(rsqrt(x)) instead of x * rsqrt(x)

The old version might be faster on EG (RECIP_IEEE is Trans only),
but it'd need extra corner case checks.
This gives correct corner case behaviour and saves a register.
Fixes OCL CTS sqrt test (1-thread, scalar) on Turks.

2 years ago[WebAssembly] Add experimental multivalue calling ABI
Thomas Lively [Sat, 18 Jan 2020 02:28:43 +0000 (18:28 -0800)]
For now, this ABI simply expands all possible aggregate arguments and
returns all possible aggregates directly. This ABI will change rapidly
as we prototype and benchmark a new ABI that takes advantage of
multivalue return and possibly other changes from the MVP ABI.

2 years agoRevert "[WebAssembly][InstrEmitter] Foundation for multivalue call lowering"
Revert "[WebAssembly][InstrEmitter] Foundation for multivalue call lowering"

This reverts commit 3ef169e586f4d14efe690c23c878d5aa92a80eb5. The
purpose of this commit was to allow stack machines to perform
instruction selection for instructions with variadic defs. However,
MachineInstrs fundamentally cannot support variadic defs right now, so
this change does not turn out to be useful.

Depends on D73927.

2 years agoEnhance debugserver's err reporting on attach fails
Enhance debugserver's err reporting on attach fails

Explicitly check for a request to attach to a pid that doesn't
exist, to attach to a pid that is already being debugged, unify the
SIP process check, and an attempt at checking if developer mode is
enabled on the system (which isn't working in debugserver, for some
reason; I can't get the authorization record which should be an
unprivileged operation and works in a standalone program I wrote).

I'll debug the developer mode check later, but I wanted to land it
along with everything else; right now it will claim that developer
mode is always enabled so it's harmless to include as-is.

2 years ago[mlir] Mark the MLIR tools for installation in CMake
[mlir] Mark the MLIR tools for installation in CMake

This binplaces `mlir-translate`, `mlir-cuda-runner`, and `mlir-cpu-runner` when building the CMake install target.

Differential Revision: https://reviews.llvm.org/D73986

2 years agoAMDGPU: Correct memory size for image intrinsics
AMDGPU: Correct memory size for image intrinsics

This was incorrectly rounding up to the next power of 2. v4f32 was
rounding up to v8f32, which was just wrong. There are also v3i16/v3f16
available in MVT, so we don't even need to round the f16 cases
anymore. Additionally, this field is really an EVT so we don't even
need to consider this.

Also switch some asserts to return invalid. We should have an IR
verifier for these intrinsic return types, but for now it's better to
not assert on IR that passes the verifier.

This should also probably be fixed to consider that dmask is really
eliminating some of the loaded components.

2 years agoDebugInfo: Hash DW_OP_convert in loclists when using Split DWARF
DebugInfo: Hash DW_OP_convert in loclists when using Split DWARF

Originally committed in: 1ced28cbe75ff81f35ac2c71e941041eb3afcd00
            Reverted in: f75301d16d444d8cb6810d679290df744bc79ec7

(reverted due to tests failing on non-linux/x86 targets, tests have since been
generalized and specialized... since Split DWARF isn't supported on non-elf
targets anyway and we have no way to run on "whatever elf target is available"
so they fail on MacOS without an explicit target triple)

This code was incorrectly emitting extra bytes into arbitrary parts of
the object file when it was meant to be hashing them to compute the DWO

Follow-up patch(es) will refactor this API somewhat to make such bugs
harder to introduce, hopefully.

2 years agoDebugInfo: Add a couple of missing COFF sections to make convert-loclist.ll pass...
DebugInfo: Add a couple of missing COFF sections to make convert-loclist.ll pass on Windows

2 years agoDebugInfo: convert-debugloc.ll generalize to run on ppc64le
DebugInfo: convert-debugloc.ll generalize to run on ppc64le

This target produces a location list for the location, so split the
match between lines to allow for a location list match.

2 years ago[lldb/Reproducers] Change the way we instrument void* arguments
[lldb/Reproducers] Change the way we instrument void* arguments

The reproducer instrumentation cannot automatically serialize and
deserialize void* arguments. Currently we deal with this by explicitly
preventing these methods from being instrumented. This has the undesired
side effect of breaking replay when that method returns a value later
used by another SB API call.

The solution is to change our approach and instrument these methods.
Instead of using the DUMMY macro, we just make (de)serialization of the
void pointer a NOOP and always return a nullptr.

2 years agoDebugInfo: Fix convert-loclist.ll Split DWARF variant to use a hardcoded triple
DebugInfo: Fix convert-loclist.ll Split DWARF variant to use a hardcoded triple

Since we don't support Split DWARF emission on non-ELF formats, hardcode
an elfine triple (we don't have a way to ask for "any ELF triple" it
seems, so hardcoded will have to do)

2 years agoRevert "[WebAssembly] Split and recombine multivalue calls for ISel"
Revert "[WebAssembly] Split and recombine multivalue calls for ISel"

This reverts commit 28857d14a86b1e99a9d2795636a5faf17674f5a2. This
commit worked toward a solution that did not turn out to be feasible
because MachineInstrs cannot contain an arbitrary number of defs.

2 years ago[BPF] disable ReduceLoadWidth during SelectionDag phase
[BPF] disable ReduceLoadWidth during SelectionDag phase

The compiler may transform the following code
  ctx = ctx + reloc_offset
  ... (*(u32 *)ctx) & 0x8000 ...
  ctx = ctx + reloc_offset
  ... (*(u8 *)(ctx + 1)) & 0x80 ...
where reloc_offset will be replaced with a constant during
AsmPrinter phase.

The above transformed code will be rejected the kernel verifier
as it does not allow
  *(type *)((ctx + non_zero_offset1) + non_zero_offset2)
style access pattern.

It is hard at SelectionDag phase to identify whether a load
is related to context or not. Sometime, interprocedure analysis
may be needed. So let us simply prevent such optimization
from happening.

Differential Revision: https://reviews.llvm.org/D73997

2 years agoRecommit: DebugInfo: Check DW_OP_convert in loclists with Split DWARF
Recommit: DebugInfo: Check DW_OP_convert in loclists with Split DWARF

Originally committed in: 552a8fe12bd1822f48dda2e9e8728a179f82d356
            Reverted in: f75301d16d444d8cb6810d679290df744bc79ec7

Reverted because it was running llc directly (rather than %llc_dwarf)
which uses COFF files on Windows which LLVM doesn't support all DWARF
features in.

This functionality isn't fully working, but sets up the testing for a
follow-on patch that demonstrates and fixes the brokenness related to
DWO ID hashing this construct.

2 years ago[WebAssembly] Enable recently implemented SIMD operations
[WebAssembly] Enable recently implemented SIMD operations

Moves a batch of instructions from unimplemented-simd128 to simd128
because they have recently become available in V8.

2 years ago[mlir][spirv] Add dialect-specific attribute for target environment
[mlir][spirv] Add dialect-specific attribute for target environment

We were using normal dictionary attribute for target environment
specification. It becomes cumbersome with more and more fields.
This commit changes the modelling to a dialect-specific attribute,
where we can have control over its storage and assembly form.

Differential Revision: https://reviews.llvm.org/D73959

2 years agoPR44786: Don't assert when profiling <=> expressions.
PR44786: Don't assert when profiling <=> expressions.

2 years agoDebugInfo: use a symbolic DIE reference in convert-loclist.ll
DebugInfo: use a symbolic DIE reference in convert-loclist.ll

2 years agoReapply: DebugInfo: Add missing test coverage for DW_OP_convert in loclists
Reapply: DebugInfo: Add missing test coverage for DW_OP_convert in loclists

Originally committed in: 5327b917e3bd0b3db352cb5a61eea7409f2d1972
      and follow on fix: 4f281f047457ce3f1870a93253476222314f420b

            Reverted in: 191a9a78b3f4bdf35a30d3480bd630d787a2fdf6
            and: f75301d16d444d8cb6810d679290df744bc79ec7

Reverted because it wasn't portable between the targets it was running
on. Using %llc_dwarf ensures the target triple is always elfine and thus
DWARF compatible.

2 years agoDebugInfo: Generalize test/DebugInfo/X86/convert-linked.ll to run with different...
DebugInfo: Generalize test/DebugInfo/X86/convert-linked.ll to run with different architectures

2 years agoDebugInfo: Generalize test/DebugInfo/X86/convert-inlined.ll
DebugInfo: Generalize test/DebugInfo/X86/convert-inlined.ll

This test was hardcoded to only run on x86-64-linux-gnu and was overly
constrained by CHECK-NEXTing every line for an exact match.

2 years agoFix warning on trailing `;`. NFC.
Fix warning on trailing `;`. NFC.

2 years ago[Remarks] Fix gcc build
[Remarks] Fix gcc build

2 years agoFix warning on trailing `;`. NFC.
Fix warning on trailing `;`. NFC.

2 years agoDebugInfo: convert-debugloc.ll remove erroneous CHECK
DebugInfo: convert-debugloc.ll remove erroneous CHECK

2 years agoDebugInfo: Generalize convert-debugloc.ll to run for multiple target architectures
DebugInfo: Generalize convert-debugloc.ll to run for multiple target architectures

This test was overly constrained & hardcoded only to x86-linux-gnu -
generalize the test & remove the hardcoded target triple.

2 years ago[gn build] Port b8a847c0a3e
[gn build] Port b8a847c0a3e

LLVM GN Syncbot [Wed, 5 Feb 2020 01:27:19 +0000 (01:27 +0000)]
[gn build] Port 7531a5039fd

2 years ago[cuda][hip] Temporarily XFAIL on arm
[cuda][hip] Temporarily XFAIL on arm

2 years agoFix BroadcasterManager::RemoveListener to really remove the listener
Fix BroadcasterManager::RemoveListener to really remove the listener

This appears to be a real bug caught by -Wunused-value. std::find_if
doesn't modify the underlying collection, it just returns an iterator
pointing to the matching element.

Reviewed By: JDevlieghere

Differential Revision: https://reviews.llvm.org/D74010

2 years ago[Remarks] Extend the RemarkStreamer to support other emitters
[Remarks] Extend the RemarkStreamer to support other emitters

This extends the RemarkStreamer to allow for other emitters (e.g.
frontends, SIL, etc.) to emit remarks through a common interface.

See changes in llvm/docs/Remarks.rst for motivation and design choices.

Differential Revision: https://reviews.llvm.org/D73676

2 years ago[NFCI] Update according to style.
[NFCI] Update according to style.

clang-tidy + clang-format

2 years agoFix some more -Wrange-loop-analysis warnings in AArch64TargetParser
Reid Kleckner [Wed, 5 Feb 2020 00:57:49 +0000 (16:57 -0800)]
2 years ago[lldb] Fix -Wdocumentation warnings
Jonas Devlieghere [Wed, 5 Feb 2020 00:44:30 +0000 (16:44 -0800)]
2 years agoFix after c25938d
Fix after c25938d

My refactor caused some changes in error reporting that TestAddDsymCommand.py
was checking, so this restores some of the changes to preserve the old
behavior and to un-xfail the affected test.

Differential Revision: https://reviews.llvm.org/D74001

2 years ago[Driver][Darwin] Improve tests for -nostdinc & friends
[Driver][Darwin] Improve tests for -nostdinc & friends

The tests were slightly underspecifying the current behavior of Clang.

2 years ago[lldb/Reproducers] Add underscore to varaibles in LLDB_RECORD macros
Jonas Devlieghere [Wed, 5 Feb 2020 00:21:31 +0000 (16:21 -0800)]
Rename all variables used in the LLDB_RECORD macros to start with an
underscore to avoid conflicts with the arguments being recorded.

2 years ago[lldb/Reproducers] Change record logging to mirror replay logging
[lldb/Reproducers] Change record logging to mirror replay logging

Pretty printing the return value, although a good idea in theory, turned
out to be more confusing than anything else because they require
printing the log statement after the arguments and resulting value have
been serialized.

This changes the logging to behave more like how deserialization is
traced, although a bit more verbose because some of the serializers are
are calling each other.

2 years ago[X86] Add custom lowering for lrint/llrint to either cvtss2si/cvtsd2si or fist.
[X86] Add custom lowering for lrint/llrint to either cvtss2si/cvtsd2si or fist.

lrint/llrint are defined as rounding using the current rounding
mode. Numbers that can't be converted raise FE_INVALID and an
implementation defined value is returned. They may also write to

I believe this means we can use cvtss2si/cvtsd2si or fist to
convert as long as -fno-math-errno is passed on the command line.
Clang will leave them as libcalls if errno is enabled so they
won't become ISD::LRINT/LLRINT in SelectionDAG.

For 64-bit results on a 32-bit target we can't use cvtss2si/cvtsd2si
but we can use fist since it can write to a 64-bit memory location.
Though maybe we could consider using vcvtps2qq/vcvtpd2qq on avx512dq

gcc also does this optimization.

I think we might be able to do this with STRICT_LRINT/LLRINT as
well, but I've left that for future work.

Differential Revision: https://reviews.llvm.org/D73859

2 years agoFix x86 32bits MLIR build (NFC)
Fix x86 32bits MLIR build (NFC)

This is fixing a build error:

error: non-constant-expression cannot be narrowed from type 'unsigned int' to 'Region::iterator::difference_type' (aka 'int') in initializer list

Fix pr44767

2 years agoFix -Wunused-result warnings in LLDB
Fix -Wunused-result warnings in LLDB

These try_lock usages intentionally ignore the result, as commented.

Similar to 4d23764dddc23e74ad165086d7f471a3e0e52bf8, which was reviewed

2 years ago[compiler-rt] fix OpenBSD and Solaris build with sigaltstack interception
Evgenii Stepanov [Tue, 4 Feb 2020 23:50:44 +0000 (15:50 -0800)]
`sigaltstack` interception is implemented D73816. This updated OpenBSD and Solaris bits to fix the build errors.

2 years ago[Support] Fix warnings in ARMTargetParser.cpp
[Support] Fix warnings in ARMTargetParser.cpp

2 years ago[lldb] Rename Type::ResolveClangType to Type::ResolveCompilerType
Alex Langford [Tue, 4 Feb 2020 23:40:43 +0000 (15:40 -0800)]
This is not specific to clang types. It operates on CompilerTypes in

2 years ago[lldb] Delete commented-out code
[lldb] Delete commented-out code

2 years agoAvoid many std::tie/tuple instantiations in ASTImporter
Avoid many std::tie/tuple instantiations in ASTImporter

To factor the error checking, use importChecked instead of importSeq.
This avoids repeating the names of all of the imported child nodes once,
and allows errors to be checked with a single conditional as it is with

  peak memory: 601.63MB
  real: 0m19.172s
  obj size: 8,352kb

  peak memory: 954.11MB
  real: 0m26.188s
  obj size: 10,000kb

The speed is not as impressive as I hoped, but the memory use reduction
is impressive, and seems worth it.

Reviewed By: martong, shafik

Differential Revision: https://reviews.llvm.org/D73675

2 years ago[X86] Give KSET0* and KSET1* pseudos the same scheduler resource usage as KXOR/KXNOR.
[X86] Give KSET0* and KSET1* pseudos the same scheduler resource usage as KXOR/KXNOR.

These aren't recognized as idioms by the CPU so they still use
execution resources. We just use the pseudo to force the input
register to k0.

2 years ago[SEH] Remove CATCHPAD SDNode and X86::EH_RESTORE MachineInstr
[SEH] Remove CATCHPAD SDNode and X86::EH_RESTORE MachineInstr

The CATCHPAD node mostly existed to be selected into the EH_RESTORE
instruction, which sets the frame back up when 32-bit Windows exceptions
return to the parent function. However, creating this MachineInstr early
increases the risk that other passes will come along and insert
instructions that use the stack before ESP and EBP are restored. That
happened in PR44697.

Instead of representing these in the instruction stream early, delay it
until PEI. Mark the blocks where this needs to happen as EHPads, but not
funclet entry blocks. Passes after PEI have to be careful not to hoist
instructions that can use stack across frame setup instructions, so this
should be relatively reliable.

Fixes PR44697

Reviewed By: hans

Differential Revision: https://reviews.llvm.org/D73752